rvest 相关问题

rvest是R的一个软件包,它提供从网页中抓取信息的功能。

R 中使用 rvest 进行网页抓取的问题

我正在尝试从这个网站上抓取政治演讲:https://www.narendramodi.in/category/text-speeches 使用 rvest 包,我刚刚开始使用以下代码: 莫迪<- "https://www.

回答 1 投票 0

R:read_html() + html_text() 的替代方案/方法也适用于没有 HTML/XML 标签的字符串

在此从字符串中删除 HTML 标签的解决方案中,字符串被传递到 rvest::read_html() 以创建 html_document 对象,然后该对象被传递到 rvest::html_text() 以返回“

回答 1 投票 0

故障排除

我有以下html字符串: html <- ' “第 1 行:abc 第 2 行:定义 3号线:ghi 4号线:jkl 第 5 行:mno" ...

回答 1 投票 0

如何使用 R 抓取 google 财经,其中多个页面的页面 url 不会更改?

我想用R网络抓取不同年份的股票财务表。但是,我可以获得去年的财务表,该表显示为默认值。但我也想从

回答 1 投票 0

rvest 函数 read_html_live() 不允许 html_elements() 正确读取

虽然 read_html_live() 确实返回一个似乎包含所有相关“位”的节点集,但我无法在其上使用 html_elements() (即使相同的网站和相同的 xpath,也可以工作

回答 1 投票 0

无法使用RSelenium从网站获取信息

我想使用RSelenium来抓取网页以检查某个文本是否存在。 我需要单击 Staatsangehörigkeitsangelegenheiten,然后单击 02. Antrag Einbürgerung [抱歉,

回答 1 投票 0

尝试从缩写名称列表中获取教育机构的完整名称

我有教育机构的缩写名称。这里给出了可重复的样本 数据<- structure(list(Affiliations = c("UNIV MELBOURNE", "UNIV NEWCASTLE", ...

回答 2 投票 0

使用 rvest 从网络上抓取元素

我正在尝试从网站上抓取元素:https://diga.bfarm.de/de/verzeichnis 我的目标是从所有 class="entity-app" 创建一个表 图书馆(rvest) 文件 <- read_html(...

回答 1 投票 0

使用 2 个 .aspx 表单下拉菜单进行网页抓取

我正在尝试在 R 中抓取此表单 - https://profiles.doe.mass.edu/statereport/enrollmentbygrade.aspx。该表单有两个下拉菜单:“报告类型”和“年份”。我一直使用此回复作为指导...

回答 1 投票 0

使用 R 抓取带有动态表的页面

我正在尝试使用 R (rvest) 从下一页抓取表格 https://www.nba.com/stats/players/passing?DateFrom=02/07/2024&DateTo=02/07/2024&dir=1 然而我注意到...

回答 1 投票 0

使用 Rselenium 抓取 google 知识图谱

我正在尝试访问谷歌搜索右侧的元素,有时称为知识图。我特别对简短的个人简介(通常是维基百科片段)和外部感兴趣......

回答 1 投票 0

难以处理 Rvest 数据抓取中的缺失信息

我目前正在使用 rvest 包在 R 中开发一个网页抓取项目。虽然该包适用于从网站提取数据,但我在处理丢失的数据时遇到了困难

回答 1 投票 0

大学课程纪律作业的网络抓取

我想用 R 抓取大学课程目录。我的代码已经相当不错了,但是学科和子学科的课程分配尚未按照我想要的方式工作。 这...

回答 1 投票 0

从网页抓取中提取文本

我正在尝试从网站获取文本 我的代码有效(有点) for (i in 1:no_urls) { this_url=urls_meetings[[i]] 页面=read_html(this_url) 文本=页面 |> html_elements("body") |&...

回答 1 投票 0

如何解决从 R 读取雅虎财经时出现的 HTTP 错误 503?

以下代码 rvest::read_html("https://finance.yahoo.com/quote/VWIUX") 产生 open.connection(x, "rb") 中的错误:HTTP 错误 503。 我知道网址没问题,因为粘贴...

回答 1 投票 0

使用选择器小工具在 R 中进行网页抓取

我正在尝试抓取以下网站:https://au.finance.yahoo.com/quote/META/analysis 我遇到了一些问题: 我使用选择器小工具突出显示表格。但它不起作用,因为它...

回答 1 投票 0

R rvest Web 抓取 JSON 格式

我正在尝试从 https://www.wheeloratings.com/tennis_wta_ ratings.html 网络抓取数据。我已经从其代码的第 367 行中获取了数据所在的确切行 查看来源:http...

回答 1 投票 0

从财政部网站上删除联邦票据收益率表

我想从财政部网站下载 10 年期联邦票据收益率:https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?数据=产量 解析...

回答 2 投票 0

将网页中的表格转换为数据框

我正在寻找一种解决方案,将网页 u 中的数据表(请参阅下面的详细信息)复制到数据框中。我的代码很短,因为我很难弄清楚如何获取该表......

回答 1 投票 0

R 中的动态网页抓取

我正在尝试抓取有关R中小行星轨道的信息。我尝试过rvest和selectorgadget,但是该网站是动态的。网站是:https://ssd.jpl.nasa.gov/tools/sbdb_lookup....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.