screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

在使用Python进行网络刮刮卡时,如何分离列和格式化日期?

我想用Python 3将这个网站上的一个图表转换成一个.csv文件。2013-14赛季NBA全国电视赛程表 图表的开头是这样的: 比赛时间 网络对阵...

回答 1 投票 0

用java编程检索亚马逊订单历史记录。

我想登录到我的亚马逊帐户,并检索购买历史在java编程。做了很多研究,遇到了屏幕抓取。这是唯一的方法,还是亚马逊提供的apis ...

回答 2 投票 12

有没有办法在VBA中选择元素集合中的某些元素?

我对VBA和数据抓取还很陌生。我想检查是否有办法在元素集合中选择某些元素。我的VBA代码如下。Sub Refresh() Dim XMLPage As ...

回答 1 投票 0

依赖的下拉选项,而Web Scraping不加载。

我正试图从以下网站中刮取数据:http:/www.equibase.comstatsView.cfm?tf=meet&tb=jockey&rbt=TB 我希望VBA代码能完成以下步骤。转到网址 点击"...

回答 1 投票 0

如何在Python中刮取这个PDF?

我想用python来刮取这个PDF的信息。我不知道从哪里开始,因为它根本没有组织。我习惯于刮取HTML。我试着把它转换为HTML,但并没有真正......

回答 1 投票 0

用scrapy刮取多个域名的最好方法是什么?

我有大约10个奇怪的网站,我希望从这些网站上搜刮。其中有几个是wordpress博客,它们遵循相同的html结构,尽管有不同的类。其他的网站要么是论坛,要么是 ...

回答 6 投票 6

脸书公开数据抓取

我正在尝试使用python从facebook上刮取公共数据,实现以下功能。使用关键字搜索和刮取数据 刮取一个配置文件 刮取一个页面 刮取一个帖子 我 ...

回答 1 投票 -2

Python DataFrame问题

我正在做一些Web抓取,并使用抓取的数据制作一个CSV。我创建了一个具有以下列的数据框:df = pd.DataFrame(columns = ['name','type','regular_price','Image src','Attribute 1 name','...

回答 1 投票 0

如何使用Puppeteer从iframe检索reCAPTCHA令牌?

我正在编写一个机器人,在完成任务后,我将使用该机器人抓取reCAPTCHA令牌。我正在尝试使用:等待page.evaluate(()=> document.getElementById('recaptcha-token')。value)...

回答 1 投票 0

如何使用Puppeteer抓取并找到type = hidden的输入?

我正在编写一个机器人,在完成任务后,我将使用该机器人抓取Recaptcha令牌。我正在尝试使用await page.evaluate(()=> document.getElementById('recaptcha-token')。value)...

回答 1 投票 0

如何在此处抓取javascript变量的数据?

这是网站的链接https://edge.pse.com.ph/companyPage/stockData.do?cmpy_id=630我想在这里获取数据:在此处输入图片描述我可以用Google工作表或python?

回答 1 投票 -1

为什么不从YouTube获取任何'a'标签?

我正在尝试通过BeautifulSoup从给定的输入频道链接中获取视频的所有链接。我发现视频的所有“ a”标记的ID均为“ video-title”,但以下代码未提供任何输出:...

回答 1 投票 0

Selenium python按类和标题获取属性

我已经在Google上进行了广泛的搜索,但无法获得答案,我正在尝试在标题中提取“ 90,856”。它的值随时间变化: ]

回答 1 投票 0

BeautifulSoup Scraper找不到文本?AttributeError:ResultSet对象没有属性'find_all'

编程超级新手,对于任何不良做法,我们深表歉意:我正在尝试制作一个能够刮除确实为我工作领域中的工作清单的刮板,并在网上关注了一些相关文章,然后...]]

回答 1 投票 1

我在Python中使用Reddit API抓取抓取了数据,但像'之类的字符显示为-t。我该如何解决?

我是Python的新手(还有StackOverflow,如果我做错了,请原谅)。我从/ r / loseit subreddit抓取了提交的内容,因此我可以清理它并在R中创建wordcloud进行分配。 ...

回答 1 投票 0

在基于Flask的网站上显示更改的Python变量

我目前正在建立一个基于Python3.6 Flask的网站,该网站托管在Flask服务器上,并提供从Web上其他来源获取的产品的实时价格,所有这些都可以在一个地方轻松找到...

回答 1 投票 0

如何使用python轻松地遍历XML子节点?

我想在此页面上抓取注释,但似乎无法了解如何遍历注释所在节点的子节点并获取数据点。这是hmtl的一部分:...

回答 1 投票 2

在HTML中我如何到达不在标记中的文本元素?

我正在尝试做一个网络抓取项目。我使用网站的精简版来简化我的工作,但图片中突出显示的元素没有任何标记。我无法列出比赛参与者...

回答 1 投票 -1

如何使用python语言中的Selenium和chromedriver刮擦此页面?

我正在尝试使用硒和chromedriver从网站“ http://www.nmpa.gov.cn/”抓取数据。当我运行代码时,chromedriver成功输入了url,但无法加载...

回答 1 投票 0


© www.soinside.com 2019 - 2024. All rights reserved.