beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4，导入为bs4。

获取BeautifulSoup以正确解析php标记或忽略它们

我目前需要解析很多.phtml文件，获取特定的html标签并为它们添加自定义数据属性。我正在使用python beautifulsoup来解析整个文档并添加标签，这......

php python parsing beautifulsoup html-parsing

回答 1 投票 0

是否有任何python包基本上将呈现的HTML结构转换为JSON / YAML格式[关闭]

例如，HTML中存在代码段落元素的示例。咖啡茶牛奶

python html beautifulsoup html-parsing

回答 1 投票 -1

BeautifulSoup找到条件的结果

如何用条件解析一些代码？我有肥皂响应，我只需要打印包含type = 1的component_id

python soap web-scraping beautifulsoup

回答 2 投票 1

修改html文件中的所有本地链接

我想改变html页面中的链接，如下所示：// html Hello 这很简单......

python regex python-3.x beautifulsoup

回答 3 投票 1

如何通过beautifulsoup过滤标准的网址链接？可能吗？确实是的

任何论坛总会有一些新帖子。我访问的那个给了帖子一个“新”贴纸。如何使用新贴纸过滤和检索网址？整蛊......我通常只是抓住了......

html python-3.x web-scraping beautifulsoup python-requests

回答 2 投票 2

解码来自abandonedrails.com的折线（编码GeoJSON）

我想从阿拉巴马州开始从abandonedrails.com提取铁路线。我正在使用beautifulsoup，然后尝试解码折线编码的LineStrings：导入请求......

python beautifulsoup escaping google-polyline

回答 2 投票 0

使用BeautifulSoup4更改html的结构

我有一个结构的HTML： ... ... ...&...

python html beautifulsoup

回答 1 投票 0

不要自动放置html，head和body标签，beautifulsoup

使用带有html5lib的beautifulsoup，它会自动放置html，head和body标签：BeautifulSoup（' FOO ', 'html5lib') # => &...

python beautifulsoup html5lib

回答 5 投票 28

如何使用Python为NOWTV可用电影刮取HTML

随着时间的推移，我正在创建一个研究数据集，它将在NOWTV上为我提供可用的电影名称。这将来自URL（https://www.nowtv.com/stream/all-movies）输出为每部电影......

python html web-scraping beautifulsoup screen-scraping

回答 2 投票 -4

在python循环中获取href链接和文本

我需要从苹果商店中获取信息，我有一个带有流派和网址的hashmap_genre_link（{'Games'：'https：//itunes.apple.com/us/genre/ios-games/id6014？mt = 8 ' ; ...} ），我想要 ...

python beautifulsoup

回答 1 投票 1

使用Python和BeautifulSoup（将保存的网页源代码保存到本地文件中）

我使用的是Python 2.7 + BeautifulSoup 4.3.2。我正在尝试使用Python和BeautifulSoup来获取网页上的信息。因为网页在公司网站上需要登录并且...

python beautifulsoup

回答 3 投票 28

BeautifulSoup不同的解析器

任何人都可以详细说明像html.parser和html5lib这样的解析器之间的区别吗？我偶然发现了一个奇怪的行为，当使用html.parser时它忽略了特定的所有标签......

python-3.x beautifulsoup

回答 1 投票 2

网页导入模块而不是使用“静态”HTML，如何使用BeautifulSoup访问这些模块

我在学校用于项目的网站不包含“静态”html，它使用一个函数来导入包含我需要抓取的HTML代码的模块，当我向...发出请求时...

web-scraping beautifulsoup

回答 1 投票 1

使用硒和美丽的汤从输入id元素返回值

我正在使用硒和美丽的蟒蛇3.6汤。我有以下示例的页面源代码。我试图找到元素可能使用输入ID，然后我想返回值“5”。 ...

python-3.x selenium beautifulsoup selenium-chromedriver

回答 2 投票 0

无法访问div内的表格（basketballreference）

我目前正在编写一个Python脚本，其中一部分从2005年至2015年NBA选秀中每个球员职业生涯的前4个赛季获得了胜利。我一直在为此而烦恼......

python web-scraping beautifulsoup

回答 1 投票 0

循环遍历页面编号链接与selenium问题

我在蟒蛇3.6中使用硒和美味的汤。我正在尝试单击页脚或页面中列出的页面。每次我点击页脚中的数字，我都会转到下一页。一世 ...

python-3.x selenium beautifulsoup selenium-chromedriver

回答 1 投票 0

使用Python刮取Sky Cinema列表

我想在Sky Cinema网站上收集一系列电影及其所有可用电影的链接。该网站是：http：//www.sky.com/tv/channel/skycinema/find-a-movie#/search？genre = all＆window = ...

python web-scraping beautifulsoup

回答 2 投票 -1

Beautifulsoup Crawler在工作中停下来

我正在写一个程序来保存sqlite数据库中的报纸评论。为刮，我正在使用美丽的汤和要求。问题是，代码只能工作几分钟然后就会停止......

python-3.x beautifulsoup web-crawler

回答 1 投票 0

在BeautifulSoup4中获取标签之间的句子长度

我试图从一个网站收集一些统计数据，我想要做的是提取一个单词和相同标签内的邻居单词的数量，例如输入 &...

python beautifulsoup

回答 1 投票 0

ModuleNotFoundError：即使安装并重新安装，也没有名为'bs4'的模块

我正在尝试运行我的Python文件。（py name.py）从bs4导入BeautifulSoup作为BS文件“C：\ Users \ Administrator \ AppData \ Local \ Programs \ Python \ Python37 \ lib \ site-packages \ bs4 \ __ init__.py”，行...

python python-3.x beautifulsoup

回答 1 投票 2

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.