beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

Python,BeautifulSoup4:选择多个属性分别等于多个值的元素

... I want to select all the elements just like above:the tag is TABLE, and there are ...

回答 1 投票 -1

bs4选择器未拍摄“图像:标题”

我正在制作网站刮刀,以便在网站上获取所有产品名称。在尝试找到产品的标题时,我不断收到KeyError。 HTML: https://开头...

回答 2 投票 0

在BeautifulSoup中使用Python中的“renderContents”

环境:Python 2.7 + BeautifulSoup 4.3.2以下是原始HTML代码的一部分: Newest Item: SE,...

回答 1 投票 2

使用BeautifulSoup和Python 2.7登录Google网站

我正在为Quora编写一个Python Web爬虫程序,但需要使用Google登录。我搜索过网,但没有什么能满足我的问题。这是我的代码:# - * - coding:utf-8 - * - import mechanize ...

回答 1 投票 0

BeautifulSoup,Scraping,获取图像大小而不在标签中?

目标:http://voorraadmodule.vwe-advertentiemanager.nl/s9376368b43e8fd6a8025bfa284d8e732/e7c2/stock/vehicles/100/我学习python已经8天了,真的很喜欢它。目标页面是我的旧...

回答 1 投票 0

Python美丽的汤提取HTML元数据

我得到一些我不太明白的奇怪行为。我希望有人可以解释发生了什么。考虑这个元数据:

回答 2 投票 1

AttributeError:'NavigableString'对象没有属性,索引超出范围

可以帮忙,因为我正在努力两天,以便在此处提供的链接中检索产品的基本信息(产品名称,图片,评级,价格)。这是我的代码,我是新来的......

回答 2 投票 -1

在BeautifulSoup中排除不需要的base64链接

我写了一个简单的图像刮刀脚本,在大多数情况下都可以使用。我遇到了一个网站,有一些不错的jpg壁纸,我想刮掉链接。该脚本工作正常,但也打印...

回答 1 投票 0

beautifulsoup - 在br标签的任一侧获取文本

遗憾的是,我遇到了以下问题: "TEXT ONE" "TEXT TWO" 我需要分别使用文本1和文本2。我只能获得......

回答 3 投票 0

如何从BeautifulSoup中的li标签之间的span标签中获取文本?

我正在尝试使用BeautifulSoup从网站上获取产品尺寸,但却被困在这里。我只需要获取文本:S,M,L,XL,XXL,XXXL,4XL,5XL代码:从urllib.request导入导入bs4 ...

回答 1 投票 1

如何将此字符串拆分为单个字符?

在BeautifulSoup对象中使用此html代码段... 507 3 3 ...

回答 3 投票 3

使用不同方法的美丽汤获得href

我正在试图抓一个网站。我学会了从两个资源中搜集:一个使用tag.get('href')从一个标签获取href,一个使用标签['href']来获得相同的结果。据我了解,......

回答 2 投票 1

BeautifulSoup和if / else语句

我正在学习如何使用BeautifulSoup,我遇到了一个问题,在我写的循环中进行了双重打印。任何见解将不胜感激!来自bs4进口BeautifulSoup导入...

回答 1 投票 0

使用Python从网站读取文本文件

您好我有问题我想从网上获取所有数据,但这太大了,无法将其保存到变量。我保存数据如下:r = urlopen(“http://download.cathdb.info/cath/releases/all -...

回答 1 投票 -1

从使用Ajax请求的网站抓取数据

到目前为止,我已经制作了一个从网站上抓取数据的程序,我已经使用python和selenium以及beautifulsoup创建了一个程序,当它想要从这个网站的页面中抓取数据时......

回答 1 投票 0

BeautifulSoup验证“title”td以提取多个表的值

我正在尝试抓取一个没有标准化输出且没有任何样式表行的样式/ id标记的旧网站,它们只是显示如下:

回答 1 投票 0

从HTML中的script元素内部提取对象键的值

window.realty = {"user_id":4243456}; <!--window.agency = < %- JSON.stringify(agency) % >;-...

回答 3 投票 2

使用多处理来处理DataFrame但列值不会更改

我有一个大型数据框,我想删除其中一列中的HTML标记。所以我使用BeautifulSoup和for循环来完成这项工作,它工作正常。像这样:从bs4导入pandas为pd ...

回答 1 投票 0

用美丽的汤刮痧数据

我正试图将我的Vudu电影列表中的电影名称刮成csv文件。我处于早期阶段,我无法弄清楚如何使用BeautifulSoup来获得名称。我知道它位于...

回答 1 投票 0

从 - BeautifulSoup python中提取字符串

我正在尝试创建一个python脚本来从Webmail中提取一些信息。我想按照重定向。我的代码:br1 = mechanize.Browser()br1.set_handle_robots(False)br1.set_cookiejar(cj)...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.