scrapy 2.3 节点之间的区别
2021-06-03 14:35 更新
//node[1] 选择所有首先出现在各自父节点下的节点。
(//node)[1] 选择文档中的所有节点,然后只获取其中的第一个节点。
例子:
>>> from scrapy import Selector
>>> sel = Selector(text="""
....: <ul class="list">
....: <li>1</li>
....: <li>2</li>
....: <li>3</li>
....: </ul>
....: <ul class="list">
....: <li>4</li>
....: <li>5</li>
....: <li>6</li>
....: </ul>""")
>>> xp = lambda x: sel.xpath(x).getall()
这是最重要的 <li> 任何父元素下的元素:
>>> xp("//li[1]")
['<li>1</li>', '<li>4</li>']
这是第一个 <li> 整个文档中的元素:
>>> xp("(//li)[1]")
['<li>1</li>']
这是最重要的 <li> 下的元素 <ul> 起源:
>>> xp("//ul/li[1]")
['<li>1</li>', '<li>4</li>']
这是第一个 <li> 元素在 <ul> 整个文档中的父级:
>>> xp("(//ul/li)[1]")
['<li>1</li>']
以上内容是否对您有帮助:
更多建议: