在r

问题描述 投票:0回答:1

这将有助于知道您从read_html()

中得到了什么,但您可能在这里面对几个问题。
通过检查Elemenets(
r web-scraping rvest
1个回答
0
投票

<div class="field field--label-inline"> <div class="field__label">Aerodrome operator:</div> <div class="field__item"> Abra Mining Pty Limited </div> </div>

尽管您很有可能从未真正从

read_html()

中收到相关内容。有了我的设置,从我的位置开始,我首先需要用一些标题来取回任何东西,例如: library(httr2) request(url) |> req_user_agent("Mozilla/5.0") |> req_headers(Connection = "Keep-Alive") |> req_perform() |> resp_body_html()

然后我接受了一个小的JavaScript挑战,该挑战在那里阻止了一些自动化工具(例如
rvest

)。

如果您安装了Chrome,则可以尝试用
{chromote}

代替。也许可以稍微调整您的策略:
read_html()

用Reprexv2.1.1

于2025-03-18创建
    

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.