scrapy 2.3 节点之间的区别

2021-06-03 14:35 更新

//node[1] 选择所有首先出现在各自父节点下的节点。

(//node)[1] 选择文档中的所有节点，然后只获取其中的第一个节点。

例子：

>>> from scrapy import Selector
>>> sel = Selector(text="""
....:     <ul class="list">
....:         <li>1</li>
....:         <li>2</li>
....:         <li>3</li>
....:     </ul>
....:     <ul class="list">
....:         <li>4</li>
....:         <li>5</li>
....:         <li>6</li>
....:     </ul>""")
>>> xp = lambda x: sel.xpath(x).getall()

这是最重要的 <li> 任何父元素下的元素：

>>> xp("//li[1]")
['<li>1</li>', '<li>4</li>']

这是第一个 <li> 整个文档中的元素：

>>> xp("(//li)[1]")
['<li>1</li>']

这是最重要的 <li> 下的元素 <ul> 起源：

>>> xp("//ul/li[1]")
['<li>1</li>', '<li>4</li>']

这是第一个 <li> 元素在 <ul> 整个文档中的父级：

>>> xp("(//ul/li)[1]")
['<li>1</li>']

以上内容是否对您有帮助：

← scrapy 2.3 按类查询使用CSS

scrapy 2.3 在条件中使用文本节点 →

写笔记

我要补充

scrapy 2.3 节点之间的区别

推荐文章

推荐教程

推荐课程