我无法使用 R selenium 取得任何进展。这是第一步和我的输出:
library(RSelenium)
rD <- rsDriver()
# checking Selenium Server versions:
# BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking chromedriver versions:
# BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking geckodriver versions:
# BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# checking phantomjs versions:
# BEGIN: PREDOWNLOAD
# BEGIN: DOWNLOAD
# BEGIN: POSTDOWNLOAD
# [1] "Connecting to remote server"
# Error in checkError(res) :
# Undefined error in httr call. httr output: Failed to connect to localhost port 4567: Connection refused
# In addition: Warning message:
# In rsDriver() : Could not determine server status.
我错过了什么?
注意:此答案适用于Windows
当尝试运行已弃用的
checkForServer()
Selenium 提供了两个选项:
参见:
RSelenium::checkForServer()
# Error: checkForServer is now defunct. Users in future can find the function in
# file.path(find.package("RSelenium"), "examples/serverUtils"). The
# recommended way to run a selenium server is via Docker. Alternatively
# see the RSelenium::rsDriver function.
每个人 似乎 to 都对 rsDriver 有问题,而 Docker 是推荐选项,所以我们将采用这条路线:
docker pull selenium/standalone-firefox
(或用chrome
代替firefox
)或在R中shell('docker pull selenium/standalone-firefox')
docker run -d -p 4445:4444 selenium/standalone-firefox
或在R中shell('docker run -d -p 4445:4444 selenium/standalone-firefox')
remDr <- remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "firefox'")
。该文档建议使用虚拟机进行一些不同的操作,但我无法让它工作。我已经准备好了,这是我的代码:
shell('docker run -d -p 4445:4444 selenium/standalone-firefox')
remDr <- remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "firefox")
remDr$open()
remDr$navigate("http://www.google.com/ncr")
remDr$getTitle()
# [[1]]
# [1] "Google"
获取更多信息的文档:
在使用 RSelenium/rsDriver 一段时间没有出现问题后,我最近收到了与 OP 非常相似的错误消息,但无法使用 Docker 来解决它(主要是出于组织原因)。我是这样解决的:
查看功能文档,发现
rsDriver()
默认配置为使用最新版本的Chrome和Firefox(Gecko)驱动程序启动Selenium服务器,即使您指定了其他驱动程序 在我的例子中,我指定了 browser = "firefox"
,但是新的 Chrome 驱动程序在最近的运行中自动下载,并且无论出于何种原因,与 Selenium 的配合不佳。这就是问题的根本原因。
这不是特别直观,并且
"Connection refused"
消息并没有真正帮助,但是遵循错误建议并检查服务器日志让我意识到 Selenium 仍在尝试加载 Chrome 驱动程序,即使我使用的是 Firefox:
rd <- rsDriver(browser = "firefox")
# Yields an error message after doing pre/post downloads:
#> Could not open firefox browser.
#> Client error message:
#> Undefined error in httr call. httr output: Failed to connect to localhost port 4567: Connection refused
#> Check server log for further details.
#> Warning message:
#> In rsDriver(browser = "firefox" :
#> Could not determine server status.
rd$server$log()
> $stderr
> [1] "Error: Could not find or load main class c(-Dwebdriver.chrome.driver=\"C:\filepath\to\chromedrivers\109.0.5414.25.chromedriver.exe\","
> $stdout
> character(0)
无论如何,如果您指定
rsDriver()
使用较旧的驱动程序版本运行,或者只是传入 NULL
所以它根本不寻找驱动程序,它可能会解决问题(它对我有用)。
# Default parameters of the rsDriver() function:
rsDriver(port = 4567L,
browser = c("chrome", "firefox", "phantomjs", "internet explorer"),
version = "latest",
chromever = "latest",
geckover = "latest",
iedrver = NULL,
phantomver = "2.1.1",
verbose = TRUE,
check = TRUE,
...)
# Specify an older driver version you know works (or just use NULL),
# even if it doesn't correspond to the browser you're using:
rd <- rsDriver(browser = "firefox",
chromever = "109.0.5414.25") # alt: chromever = NULL
如果您正在查找 RSelenium 自动下载时保存这些驱动程序的文件路径(例如,您可能想查找旧驱动程序版本的名称),在 Windows 上,它应该是
~/AppData/Local/binman
。
感谢对这个问题的回答,这也帮助我指明了正确的方向!
如果这仍然有用,我今天遇到了同样的问题,并且能够通过安装 Java 开发工具包(Java SE 开发工具包 11.0.1)来修复它。
我从我的计算机收到了一条错误消息,以及这个问题中提到的相同的 R 错误,并且它修复了它。
对于可重现的示例,我能够复制此教程。
会话信息() R版本3.4.4 (2018-03-15) 平台:x86_64-apple-darwin15.6.0(64位) 运行于:macOS High Sierra 10.13.5
Matrix products: default
BLAS: /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/3.4/Resources/lib/libRlapack.dylib
locale:
[1] fr_CA.UTF-8/fr_CA.UTF-8/fr_CA.UTF-8/C/fr_CA.UTF-8/fr_CA.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] RSelenium_1.7.5
loaded via a namespace (and not attached):
[1] Rcpp_0.12.17 XML_3.98-1.11 binman_0.1.1 assertthat_0.2.0 rappdirs_0.3.1 bitops_1.0-6
[7] R6_2.2.2 jsonlite_1.5 semver_0.2.0 httr_1.3.1 curl_3.2 xml2_1.2.0
[13] subprocess_0.8.3 tools_3.4.4 wdman_0.2.4 yaml_2.1.18 compiler_3.4.4 caTools_1.17.1
[19] openssl_1.0.1
2023 年,我使用 chrome 并收到此错误,对我有用的解决方案是删除以下目录中的 LICENSE.chromedriver(在 Windows 10 上):
C:\Users\YOURUSERNAME\AppData\Local\binman\binman_chromedriver\win32\114.0.5735.16
或
C:\Users\YOURUSERNAME\AppData\Local\binman\binman_chromedriver\win32\YOURCHROMEVERSION
我不知道它为什么有效,这是由一位我不记得名字的 YouTuber 推荐的,并且它在三个单独的安装中都有效。
更新(2024 年 3 月):在开发 RSelenium 时,我最终放弃了 Chrome,转而使用 FireFox,而且它运行得更好。
根据克兰小插图,我必须运行:
shell("docker-machine ip")
然后将remoteServerAddr设置为返回的IP。