<code><span data-v-d3a5356a="" class="metadata--doi">DOI: <a data-v-d3a5356a="" id="article--doi--link-metadataSec" href="//doi.org/10.1007/s00508-019-1485-6">10.1007/s00508-019-1485-6</a>&nbsp;</span> </code>

问题描述 投票:0回答:2

网页是一个动态页面 -
意味着数据由JavaScript加载。

将无法与动态页面一起使用。您必须使用

beautifulsoup
来刮擦此站点。
,但是,如果您在Chrome DevTools的“网络”选项卡下看到,您可以看到数据正在从API加载。您可以直接从该API获取数据。这是

link

python beautifulsoup
2个回答
0
投票
如何从该API端点提取数据。

selenium import requests url = 'https://europepmc.org/api/get/articleApi?query=(EXT_ID:30980146%20AND%20SRC:med)&format=json&resultType=core' r = requests.get(url) x = r.json() print(f"DOI: {x['resultList']['result'][0]['doi']}")

    

RAM

已经显示了如何从DOI: 10.1007/s00508-019-1485-6 中刮擦DOI数据,我还添加了代码示例以提取doi链接和摘要,并将所有内容组合在一起,包括从:doi,doi,doi url,Abstract.inter.

1

看了

europepmc.org
full输出:

0
投票

如果您正在寻找Google Scholar中的DOI论文,我有一个坏消息,

'Scholarly'库不准确地提供论文doi,但一个好消息是,您可以使用额外的工具来提取doi论文。对于每个返回的出版物,这个Python脚本都试图通过Crossref的API匹配标题来找到DOI。 (请记住,Google Scholar并不总是显示DOI,因此此方法使用外部查找。
ieeexplore.ieee.org
    

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.