Scrapy:无法使用CSS选择器提取属性字段

问题描述 投票:0回答:1

这里是HTML代码

<!DOCTYPE html>
<html lang="en">
<div class="container" id="content-area">
    <div class="flex-row flex-baseline flex-space-between" data-id="1826" id="info">
      <h1 class="no-margin">XYZ</h1>
        <div class="new-stack" id="sublists">Added</div>
    </div>
</div>

我正在寻找data-id标签内的div属性。这是我正在尝试使用CSS选择器的内容

>>> response.css("#content-area div")[0].css("::attr[data-id]").get()

而且我得到以下错误

cssselect.parser.SelectorSyntaxError: Got pseudo-element ::attr not at the end of a selector

这是我通过组合CSS和XPATH选择器解决的方法。

>>> response.css("#content-area div")[0].xpath("@data-id").get()
'1826'

是否有解决方案可以仅使用CSS选择器来做到这一点?

web-scraping scrapy css-selectors
1个回答
0
投票

您需要使用()而不是[]

© www.soinside.com 2019 - 2024. All rights reserved.