如何使用Scrapy和Xpath刮取多个元素?

问题描述 投票:0回答:2

我正在尝试抓取一个网站。我需要获取产品名称及其参考。我正在抓取的HTML代码是:<li> <a href="wensite?area=areacode" class="dropdown-element" data-code="areacode" style="cursor: pointer;">Name of the item</a>

蜘蛛程序需要生成一个带有产品名称及其区号的元组。目前,我可以使用以下Xpath选择器'// li / a [@href] / text()'抓取项目名称,但我不知道如何同时产生区号。

谢谢您的帮助

python xpath scrapy css-selectors tuples
2个回答
0
投票

尝试使用此xpath表达式刮取区号

//li/a/@data-code

0
投票

要同时获取区号和商品名称,请尝试以下表达式:

//li/a[@href]/(@data-code,text())/string()
© www.soinside.com 2019 - 2024. All rights reserved.