Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。
我只是Python的初学者。我试图从网站上抓取数据并设法编写下面的代码。但是,我不知道如何继续前进,因为我无法获得href标签...
我有这两个场景,我想使用正则表达式通过文本搜索标签。汤= BeautifulSoup(“TEXT ", "...
Python:如果XML标签不存在,我需要打印'Blank'和Output
忽略以下文本段落XML代码,万维网联盟(W3C)的正式建议类似于超文本标记语言(HTML)。 XML和HTML都包含标记符号......
如何使用python和beautifulsoup4循环和抓取多个页面的数据
我必须迭代超过4000页:在每页之后。当我们到达可用的最后一页时,没有更多的页面,所以我们已经完成并可以退出循环,例如持续。可能没有......
我试图从以下网页中提取成分列表:https://skinsalvationsf.com/2012/08/updated-comedogenic-ingredients-list/所以我要拉的第一个成分是......
我想使用python代码下载bing搜索图像。示例网址:https://www.bing.com/images/search?q = sketch%2520using%20iphone%2520students我的python代码生成一个bing搜索网址为...
解析BeautifulSoup,错误消息TypeError:强制转换为Unicode:需要字符串或缓冲区,找到NoneType
所以我正试图抓取一个亚马逊页面的数据,当我试图解析卖家所在的位置时,我收到了一个错误。这是我的代码:#getting the html request = urllib2.Request('http:// www ....
我试图从'YP_LA_Remodel_urls.csv文件中提取网址(我在下面包含了几个),抓取它们,然后将结果导出到Yp_LA_Remodel_Info.csv。如果我拿一个网址(不是来自csv)和......
我正在尝试使用以下脚本从网页抓取图像链接,但是当我运行它时,脚本从那里获取两个链接(相同的链接两次)。为什么我会得到如此奇怪的结果?我需要 ...
我正在搜集中央银行研究出版物的信息,到目前为止,对于美联储,我有以下Python代码:START_URL ='https://ideas.repec.org/s/fip/fedgfe.html'page = ...
我正在尝试从网站解析HTML,其中有多个元素具有相同的类ID。我似乎无法找到解决方案;我设法得到一个项目但不是全部。这里有点......
几个星期前我正在抓取这个网站,但有些代码不再适用。此代码按预期返回所有内容:来自bs4 import BeautifulSoup导入请求url ='https:// www ....
我有以下代码工作,将在value = soup = BeautifulSoup(html,'lxml')之后打印文本name = soup.find('input')['value'] print(name)但页面有多个div ...与......
我正在尝试从tripadvisor为特定航空公司Spicejet提取年仅一年的评论。链接:https://www.tripadvisor.com/Airline_Review-d8728949-Reviews-or60-SpiceJet#REVIEWS但是......
我试图废弃所有的测试匹配细节,但它显示HTTP错误504:网关超时我得到测试匹配的详细信息,但它没有显示这是我的代码我用bs4来...
BeautifulSoup成功写入html但find_all没有返回任何内容
我正在使用BeautifulSoup来创建和编写html文件。我能够为MWE创建一个简单的html,如下所示。但是,所有查找函数都不返回任何内容,因此无法执行进一步操作(...
我有一批网址列表,我想抓取一些关于这些网址的信息daa = ['https://old.reddit.com/r/Games/comments/a2p1ew/','https:// old。 reddit.com/r/Games/comments/9zzo0e/','https:// ...
我正在尝试将此URL中的数据转换为适合Excel的格式但是卡住了。使用此代码,我设法将数据放入行中,但由于某种原因,它们与行#不对应。能够 ...
我正在使用Python with Requests和Beautiful Soup尝试使用以下代码返回某些Youtube频道的订阅者数量:从bs4 import BeautifulSoup请求导入请求...
这可能是一个比我的用例更广泛的问题。我正在使用Beautifulsoup从html文档中提取数据。对于那些对Beautifulsoup不熟悉的人来说,它基本上是在解析......