rvest 相关问题

rvest是R的一个软件包,它提供从网页中抓取信息的功能。

使用 R 进行网页抓取:read_html_live() - 正确的 css 选择器来执行点击

这是我的基本网址:https://obchody.heureka.sk/?f=1 这包含在线商店列表,我想抓取他们的基本信息。然而,该页面上不存在 url,因为这是由 ...

回答 1 投票 0

我使用 `rvest` 抓取网页并将 read_html() 的结果存储在列表对象中。我关闭了 Rstudio,当我重新打开并尝试加载时,出现错误

这就是我所做的: 图书馆(rvest) 列表[[i]] <- read_html(link) save(list, path = "path.Rdata") Then I closed and reopened the environment. load("path.Rdata") list[[i]] ...

回答 1 投票 0

R 中使用 rvest 进行网页抓取的问题

我正在尝试从这个网站上抓取政治演讲:https://www.narendramodi.in/category/text-speeches 使用 rvest 包,我刚刚开始使用以下代码: 莫迪<- "https://www.

回答 1 投票 0

R:read_html() + html_text() 的替代方案/方法也适用于没有 HTML/XML 标签的字符串

在此从字符串中删除 HTML 标签的解决方案中,字符串被传递到 rvest::read_html() 以创建 html_document 对象,然后该对象被传递到 rvest::html_text() 以返回“

回答 1 投票 0

故障排除

我有以下html字符串: html <- ' “第 1 行:abc 第 2 行:定义 3号线:ghi 4号线:jkl 第 5 行:mno" ...

回答 1 投票 0

如何使用 R 抓取 google 财经,其中多个页面的页面 url 不会更改?

我想用R网络抓取不同年份的股票财务表。但是,我可以获得去年的财务表,该表显示为默认值。但我也想从

回答 1 投票 0

rvest 函数 read_html_live() 不允许 html_elements() 正确读取

虽然 read_html_live() 确实返回一个似乎包含所有相关“位”的节点集,但我无法在其上使用 html_elements() (即使相同的网站和相同的 xpath,也可以工作

回答 1 投票 0

无法使用RSelenium从网站获取信息

我想使用RSelenium来抓取网页以检查某个文本是否存在。 我需要单击 Staatsangehörigkeitsangelegenheiten,然后单击 02. Antrag Einbürgerung [抱歉,

回答 1 投票 0

尝试从缩写名称列表中获取教育机构的完整名称

我有教育机构的缩写名称。这里给出了可重复的样本 数据<- structure(list(Affiliations = c("UNIV MELBOURNE", "UNIV NEWCASTLE", ...

回答 2 投票 0

使用 rvest 从网络上抓取元素

我正在尝试从网站上抓取元素:https://diga.bfarm.de/de/verzeichnis 我的目标是从所有 class="entity-app" 创建一个表 图书馆(rvest) 文件 <- read_html(...

回答 1 投票 0

使用 2 个 .aspx 表单下拉菜单进行网页抓取

我正在尝试在 R 中抓取此表单 - https://profiles.doe.mass.edu/statereport/enrollmentbygrade.aspx。该表单有两个下拉菜单:“报告类型”和“年份”。我一直使用此回复作为指导...

回答 1 投票 0

使用 R 抓取带有动态表的页面

我正在尝试使用 R (rvest) 从下一页抓取表格 https://www.nba.com/stats/players/passing?DateFrom=02/07/2024&DateTo=02/07/2024&dir=1 然而我注意到...

回答 1 投票 0

使用 Rselenium 抓取 google 知识图谱

我正在尝试访问谷歌搜索右侧的元素,有时称为知识图。我特别对简短的个人简介(通常是维基百科片段)和外部感兴趣......

回答 1 投票 0

难以处理 Rvest 数据抓取中的缺失信息

我目前正在使用 rvest 包在 R 中开发一个网页抓取项目。虽然该包适用于从网站提取数据,但我在处理丢失的数据时遇到了困难

回答 1 投票 0

大学课程纪律作业的网络抓取

我想用 R 抓取大学课程目录。我的代码已经相当不错了,但是学科和子学科的课程分配尚未按照我想要的方式工作。 这...

回答 1 投票 0

从网页抓取中提取文本

我正在尝试从网站获取文本 我的代码有效(有点) for (i in 1:no_urls) { this_url=urls_meetings[[i]] 页面=read_html(this_url) 文本=页面 |> html_elements("body") |&...

回答 1 投票 0

如何解决从 R 读取雅虎财经时出现的 HTTP 错误 503?

以下代码 rvest::read_html("https://finance.yahoo.com/quote/VWIUX") 产生 open.connection(x, "rb") 中的错误:HTTP 错误 503。 我知道网址没问题,因为粘贴...

回答 1 投票 0

使用选择器小工具在 R 中进行网页抓取

我正在尝试抓取以下网站:https://au.finance.yahoo.com/quote/META/analysis 我遇到了一些问题: 我使用选择器小工具突出显示表格。但它不起作用,因为它...

回答 1 投票 0

R rvest Web 抓取 JSON 格式

我正在尝试从 https://www.wheeloratings.com/tennis_wta_ ratings.html 网络抓取数据。我已经从其代码的第 367 行中获取了数据所在的确切行 查看来源:http...

回答 1 投票 0

从财政部网站上删除联邦票据收益率表

我想从财政部网站下载 10 年期联邦票据收益率:https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?数据=产量 解析...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.