beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

用 beautifulsoup 抓取歌词

使用 Genius API,我获取了歌词页面的歌曲 url。我现在想使用 beautifulsoup4 进行网络爬虫;但是,我遇到了一个错误。这是代码: 从 bs4 导入 BeautifulSoup 导入请求...

回答 4 投票 0

从 json python 请求中抓取值

因此,我正在网站上构建一个尺寸抓取工具,但我很困惑如何从该 JSON 中提取“EUR”和“pieces”。我想打印所有尺寸,例如“EU 41 = Pieces 6”。

回答 1 投票 0

尝试从列表中选择一个选项进行抓取时出现问题 - Python

我正在尝试抓取以下页面中包含的表格:https://predictioncenter.org/casp14/results.cgi?view=tables&target=T1024&model=1&groups_id= 在桌子的顶部,我...

回答 2 投票 0

使用beatifulsoup抓取时无法获取索引5之后的数据

这是我的代码。 从 bs4 导入 BeautifulSoup 导入请求 导入时间 导入 mysql.connector 标题={ "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit...

回答 1 投票 0

使用Python selenium 抓取动态网站

目标是从每张工作卡中抓取信息以创建数据库。为此,我尝试执行以下步骤。 获取现有页面的最大数量 从每张工作卡上获取 ID ...

回答 2 投票 0

当我用 BeautifulSoup&Python 抓取网页时,我没有得到我想要的结果数量

当我尝试获取结果计数时,我得到了{{memberVm.disclosures.length}}。我想得到结果的计数。它位于列表的顶部。例如“34 bildirim bulundu”。我想要34,而不是{{我...

回答 1 投票 0

用 beautifulsoup 刮的类似课程

我有这段代码,我想为每个url找到相应的类。有一个 url 有两个相似的类,第一个是 class='something and-something-else',第二个是 class='

回答 1 投票 0

尝试从 div 标签中抓取文本,但得到 Nonetype

我正在用Python抓取一个房地产网站,但我一直试图抓取代理商的公司名称。我收到 AttributeError: 'NoneType' 对象没有属性 'text. 任何帮助表示赞赏。

回答 1 投票 0

Python - 抓取 <br> 内不在 <p>

我正在尝试抓取此网站的内容:https://public.era.nih.gov/pubroster/roster.era?CID=102353,我可以针对以 ANANDASABAPATHY 开头的名称执行此操作,这些名称是包含

回答 1 投票 0

使用 Python 从网站上抓取表格

我尝试了几种适用于其他网站但不适用于此网址的方法。 https://www.wunderground.com/hourly/es/barcelona/IBARCE215/date/2022-07-25 日期(例如2022-07-25)应该在未来...

回答 1 投票 0

由于分页问题,无法使用 python al beautifulsoup 在 tripadvisor 中获取所有结果

我正在尝试获取餐厅的链接,但我只能获取前 30 家,而无法获取所有其他餐厅。 马德里地区的餐厅有几百家,分页每页只显示30家,以下...

回答 1 投票 0

Python - 抓取 p → 字体中的文本

我正在尝试抓取此页面中包含的信息:https://web.archive.org/web/20190718200413/https://public.era.nih.gov/pubroster/jsp/preRosIndex.jsp?CID =102353&议程=365050 基础...

回答 1 投票 0

仅用美丽的汤从谷歌抓取 src 属性

我正在尝试抓取谷歌图像。当 beautiful soup 提取“src”时,它会输出链接 数据:图像/gif;base64,R0lGODlhAQABAIAAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw== 这不是真实的...

回答 3 投票 0

Python 上的 BeautifulSoup 问题 - 属性错误

我只是想做一个电报机器人,它会向我发送有关 NFT 项目底价的更新信息。我尝试使用 BeautifulSoup 来刮底价,代码如下: 来自 urllib.req...

回答 1 投票 0

如何使用 BeautifulSoup 从属性中抓取 eBay 列表 ID?

我正在尝试编辑代码以抓取多个列表的 eBay 列表 ID。现在,它会删除列表标题和价格。我不知道如何从...

回答 1 投票 0

在 bs4 中的网页抓取中不需要输出

我正在抓取产品信息。但我刮掉了它的价格,它并没有给我适当的输出。没有错误,但不是所需的输出。 而且在查找

回答 2 投票 0

Beautifulsoup 不要刮掉 div 样式元素

从requests_html导入HTMLSession 从 bs4 导入 BeautifulSoup url = 'https://kephiso.webuntis.com/WebUntis/monitor?school=Kurt-Schwitters-Schule&monitorType=subst&format=Klassen' 瑟...

回答 1 投票 0

在python中使用BeautifulSoup从url的源代码中提取特定部分下的文本

我是Python的初学者,对HTML没有任何经验。我刚刚看了一个关于网页抓取的 YouTube 视频 (https://www.youtube.com/watch?v=kEItYHtqQUg&ab_channel=edureka%21) 并得到了

回答 1 投票 0

使用Requests bs4 Python3.8从长元素中抓取文本

我在Ubuntu 20.04上使用Python3.8.5。我怎样才能将下面显示的这个 html 和在这里找到的内容抓取到 Pandas DataFrame 中。 这是我当前的代码: 导入路径库 导入系统 导入lxml 导入熊猫...

回答 2 投票 0

list() 在一行中,不能引入 /newlines

作为一个项目,我正在编写一个网站,其中包含游戏中某些怪物的统计数据,问题是,当我将数据附加到列表中时,它会以非常长的单个 l 的形式打印...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.