我正在尝试抓取一个网站。我需要获取产品名称及其参考。我正在抓取的HTML代码是:<li>
<a href="wensite?area=areacode" class="dropdown-element" data-code="areacode" style="cursor: pointer;">Name of the item</a>
蜘蛛程序需要生成一个带有产品名称及其区号的元组。目前,我可以使用以下Xpath选择器'// li / a [@href] / text()'抓取项目名称,但我不知道如何同时产生区号。
谢谢您的帮助
尝试使用此xpath表达式刮取区号
//li/a/@data-code
要同时获取区号和商品名称,请尝试以下表达式:
//li/a[@href]/(@data-code,text())/string()