beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

我无法使用Python的Beautiful Soup在CSV文件上写

我的目标是编写一个可以从网站检索特定数据的Python脚本。具体而言,我必须提取这些数据:191,Corso ......

回答 2 投票 -1

熊猫:无法从DataFrame列中剥离HTML标记

我有一个Pandas DataFrame,其中包含一个包含HTML的文本列。我想获得文本,即剥离标签。我尝试按如下方式执行此操作:从bs4导入BeautifulSoup result_df ['text'] = ...

回答 3 投票 1

Beautifulsoup Webscraping:如何使用javascript获取信息?

我正在尝试从Choice Hotel的网站(特别是https://www.choicehotels.com/tennessee/nashville/hotels)网页抓取特定页面,以创建田纳西州纳什维尔所有精选酒店的列表。 ...

回答 2 投票 0

soap.findAll('table',class _ ='wikitable sortable')不起作用

我刚写了一个简单的查询来解析html页面中的数据。但是我得到一个空的结果列表,即使页面中存在这样的类。这是我的代码:从bs4导入BeautifulSoup导入urllib ...

回答 2 投票 0

使用Beautiful Soup删除元素的第一个实例

我一直在尝试使用BeautifulSoup删除元素的第一个实例,我确信我遗漏了一些东西。我没有使用find all因为我需要定位第一个总是...

回答 1 投票 0

.next_sibling返回类型NoneType

我是Python的新手,我正在尝试访问标签下一个兄弟的信息。 HTML代码看起来像这样: "Title"

回答 1 投票 0

转换为字符串untagged child美丽的汤

我正在尝试使用BeautifulSoup4废弃一些html文档,但我试图废弃这个div: 5

回答 1 投票 1

在python中的一个re.compile语句中排除/包含字符串以提取感兴趣的URL [关闭]

所以我试图获取包含特定字符串的网址,同时避免包含错误字符串的网址。所以我不希望任何包含字符串“/ inventory / all /”的网址,我只想要网址...

回答 1 投票 -1

使用硒和bs4进行网络刮擦

我正在尝试建立一个基于网页报废页面的数据框https://www.schoolholidayseurope.eu/choose-a-country html firstable我说selenium点击我选择的页面然后我把...

回答 1 投票 4

用beautifulsoup在python中创建表

这是python的新手,我有一个关于使用美丽的汤来创建一个桌子的问题。这是我正在使用的代码:import requests page = requests.get(“https://www.opensecrets.org/lobby / ...

回答 1 投票 1

Python Web Scraping:美丽的汤

我在抓取网页时遇到问题。我试图获得两个团队之间的差异(例如:+ 2,+ 1,......),但是当我应用find_all方法时,它返回一个空列表......来自......

回答 3 投票 4

在美丽的汤中提取HTML表,获得重复元素

第二次尝试网页抓取,并遇到一个奇怪的错误。我要做的最终结果是废弃表并将每一行放入一个SQL表,但这有90s样式嵌套表,...

回答 1 投票 0

使用beautifulsoup分隔由`分隔的字符串 `

我想从使用的网站获取一些数据 。在使用beautifulsoup4解析的html中,有时我有以下模式:“ 文本1。 text_2(text_3

回答 1 投票 0

使用python从javascript标记中解析可变数据

我正在使用BeautifulSoup和Requests抓取一些网站。我正在检查的页面中有一个数据位于标记内。它......

回答 1 投票 11

如何摆脱BeautifulSoup用户警告?

安装BeautifulSoup之后,每当我在cmd中运行我的Python时,就会出现这个警告。 D:\ Application \ python \ lib \ site-packages \ beautifulsoup4-4.4.1-py3.4.egg \ bs4 \ __ init__.py:166:UserWarning:No ...

回答 3 投票 37

如何通过使用python 3从带有类名的“a”中获取href的链接

我试图从谷歌地图获取该元素的链接: str.rplit

回答 2 投票 0

Python 3:如何从包含多个类值的div中抓取文本

我正在尝试网页抓一个网站(这里是链接到网站),但页面中的div似乎有多个类属性,这使我很难刮掉数据。我试着寻找......

回答 5 投票 2

如何在Python中使用BeautifulSoup创建链接?

我正在尝试构建一个HTML页面,其中包含一个包含信息行的表(测试用例,失败,警告,测试总数)我希望测试用例列中的每一行都是指向另一个页面的链接。当你......

回答 1 投票 1

如何从Python上Twitch的特定频道获取所有链接或剪辑?

从bs4导入来自urllib.request的BeautifulSoup导入请求,urlopen import re req = Request(“https://www.twitch.tv/directory/game/League%20of%20Legends/clips”)html_page = urlopen(req)soup = ...

回答 1 投票 -1

bs4抓python获取内容直到特定的类名

我想抓住这个网站https://www.eduvision.edu.pk/institutions-detail.php?city=51I&institute=5_allama-iqbal-open-university-islamabad,我只想要这个网址中的单身汉数据。 ..

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.