beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

使用beautifulSoup和python来查找html中最大链接序列的长度?

我的任务是找到文章的正文 and inside it calculate the length of the maximum sequence of links between which there are no other tags that opened or closed. For ...

回答 1 投票 0

尝试使用Python和BeautifulSoup来提取精确值

嗨伙计们,我有一个我需要解析的HTML页面。所以我需要姓名和电子邮件地址。姓氏:电子邮件地址:所以我试过这个:从bs4导入BeautifulSoup def get_page_data(...

回答 1 投票 1

Python BS4.element.tag如何对此执行click()

我有一个bs4.element模块的ResultSet对象,它是一个派生自此的集合:def unexpanded_league_tables(flash_page):unexpanded_elements = flash_page.find_all(“span”,{“class”:“expand -...

回答 1 投票 0

如何使用BeautifulSoup4从HTML表中提取所有项目?

这是我正在抓的更大网站的HTML:https://pastebin.com/LZ3mJKv0基本上我希望我的输出为:品种:西施价格:$ 850性别:男昵称:韦德年龄:16 ...

回答 1 投票 0

无法使用beautifulsoup在python中删除链接

我想废弃标签和class =“author track”的网页上的所有链接。在网页上有这样的多个URL但是当我运行程序时,我的列表是空的一个HTML示例: - &...

回答 1 投票 2

bs4是否检索整个网页,即使它需要物理滚动才能获得所有元素?

我是编码的新手,我正在学习Python,我也很抱歉,如果我在这篇文章中违反任何规则。我的问题是,如标题中所述,我可以获得bs4下载整个...

回答 1 投票 1

如何使用BeautifulSoup查找与类的href链接

I am used to scraping html with BS4 but I ...

回答 2 投票 0

python beautifulsoup new_tag:将类指定为属性

我是python和beautifulsoup的新手,所以也许有一个我找不到的简单答案。当我打电话给.new_tag('name')时,我也可以分配像.new_tag这样的属性('a',href ='#',id ='link1')但是我可以......

回答 2 投票 7

是否可以使用lxml的bs4汤对象?

我试图使用BS4和lxml,所以不是解析html页面两次,有没有办法在lxml中使用汤对象,反之亦然? self.soup = BeautifulSoup(open(path),“html.parser”)我试过......

回答 1 投票 0

Python - Beautifulsoup | ValueError:不支持或无效的CSS选择器:“

我试图从fareham.gov.uk网页上删除一个应用程序,每次我尝试它都会返回错误而不是参考号。有人可以帮我解决这个问题吗?我是新来的......

回答 1 投票 0

美丽的汤:从HTML中检索项目

我有以下源代码: Bedrooms 4 I want to retrieve the number of ...

回答 1 投票 1

美丽的汤 - 我们怎样才能获得元素 element?

如果我有一个html如下,我用美丽的汤来解析它,我怎么能访问之前的行 element. ..

回答 1 投票 2

如何废弃审查数据在阅读更多Flipkart评论中

我正在尝试使用请求和beautifulsoup包来抓取Flipkart提取产品的评论。我们可以取出存在于这些评论中的更多点击事件中的数据。

回答 1 投票 0

使用Python将url作为文本获取时出现关键错误

我正在尝试获取数据并导出到CSV,我有主URL页面和第二个URL主页,我已导入以下这些:从bs4 import BeautifulSoup import urllib.request from ...

回答 1 投票 1

错误'NoneType'对象没有属性'find'有时会导致

我正在通过从赛马结果网站提取数据来学习使用Python(3.7)和BS4进行网络抓取。该网站是http://racing.hkjc.com/racing/Info/Meeting/Results/English/Local/20080412/ST/5 ...

回答 1 投票 0

使用BeautifulSoup和/或Selenium导航html树

我刚刚开始使用BeautifulSoup并且在一开始遇到了障碍。我查找了类似的帖子,但没有找到解决我的具体问题,或者有一些基本的东西......

回答 1 投票 0

Python BeautifulSoup html.parser无效

我有一个脚本来从亚马逊提取书籍信息,这些信息之前成功运行但今天失败了。我无法确切地知道出了什么问题,但我假设它...

回答 2 投票 0

Python解析表

我用这段代码解析了表:response = urllib.request.urlopen(url)html = response.read()soup = BeautifulSoup(html,'html.parser')table = soup.find(“table”,attrs = { “班级”:“餐桌 - ...

回答 1 投票 0

使用beautifulSoup从HTML中提取文本

我试图解析一个美丽的汤4的HTML,但无法获取数据 A Show

回答 1 投票 0

如何在python中废弃元素值中的t \值

我到处搜索,但找不到答案。我需要获取elemant值内的内容,例如我需要从下面获取值(Xerox WorkCentre 7220),请帮忙。

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.