我正在尝试使用以下代码使用 Python Selenium 登录网站:
import time
from contextlib import contextmanager
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
@contextmanager
def getBrowser(*options):
chrome_options = Options()
if options: [chrome_options.add_argument(option) for option in options]
browser = webdriver.Chrome(chrome_options=chrome_options)
try:
yield browser
finally:
browser.quit()
with getBrowser() as browser:
browser.get('https://www.vinted.com/members/notifications')
time.sleep(20)
browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()
它工作得很好,但是当我将
--headless
选项添加到浏览器时,它会引发 NoSuchElementException
。
错误代码:
with getBrowser('--headless') as browser:
browser.get('https://www.vinted.com/members/notifications')
time.sleep(20)
browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()
追溯:
Traceback (most recent call last):
File "<ipython-input-4-fe0834deb137>", line 1, in <module>
runfile('C:/Users/Alec/vinted test case.py', wdir='C:/Users/Alec')
File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 705, in runfile
execfile(filename, namespace)
File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
exec(compile(f.read(), filename, 'exec'), namespace)
File "C:/Users/Alec/vinted test case.py", line 27, in <module>
browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()
File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 354, in find_element_by_xpath
return self.find_element(by=By.XPATH, value=xpath)
File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 832, in find_element
'value': value})['value']
File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 297, in execute
self.error_handler.check_response(response)
File "C:\Users\Alec\selenium\webdriver\remote\errorhandler.py", line 194, in check_response
raise exception_class(message, screen, stacktrace)
NoSuchElementException: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span"}
(Session info: headless chrome=65.0.3325.181)
(Driver info: chromedriver=2.36.540470 (e522d04694c7ebea4ba8821272dbef4f9b818c91),platform=Windows NT 10.0.16299 x86_64)
此错误仅在浏览器无头时发生。是什么导致了这种行为?可以使其在无头模式下工作吗?
目标 HTML:
<div class="u-flex-grow">
<a class="c-button--inverse c-button--normal c-button--amplified c-button " href="/member/general/login?ref_url=%2Fmembers%2Fnotifications"><span class="c-button__content">Log In</span></a>
</div>
我也有同样的问题。解决方案是添加 usr-agent:
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'
chrome_options.add_argument('user-agent={0}'.format(user_agent))
我通过打印页面找到了原因
browser.get(url)
print(browser.page_source)
然后返回 html 说权限拒绝,所以我用谷歌搜索它。 按照解决方案: 如何通过无头驱动程序访问站点而不被拒绝许可
我曾经在使用此类工具的版本时遇到过一些麻烦。我通过确保安装了最新版本的 Chrome 和 webdriver 解决了这个问题。也许这是一个类似的问题?
但除此之外,您的选择器还取决于很多元素。因此,想象 html 在无头模式下看起来有点不同可能会导致您的问题。
我会尝试获得一个不太严格的选择器,如下所示:
//a[starts-with(@href,'/member/general/login?')]
如果这不起作用,请尝试在无头模式下将 html 转储到文件中。只是为了看看无头浏览器看到了什么,并尝试用它构建一个奇特的选择器。
我也有同样的问题。解决方案是提供窗口大小:
chrome_options.add_argument("--window-size=1920x1080")
当我在 python 代码中添加 --headless 时,我遇到了同样的问题。 我使用ActionChains
解决了这个问题from selenium.webdriver import ActionChains
text_list = browser.find_elements_by_xpath("//div[@class='tab-content']")
ActionChains(browser).click(text_list).perform()
我遇到了类似的问题,直到我意识到某些元素类会根据
theme of the website
而改变。在意识到之前,我已经在页面处于黑暗模式时定义了 css 选择器和 xpath。当无头运行时,页面将处于轻型模式(通过保存屏幕截图知道)。我保存了整个 html 源代码,在检查它时,我发现一些类发生了变化,因此一些 css 选择器和 xpath 失败了。我所做的是创建一个单独的 chrome 配置文件,并从该配置文件中将网站的主题更改为浅色模式。然后我重新定义了我的 css 选择器和 xpath,将此配置文件设置为我的机器人,一切都按预期工作。
浏览器的默认主题可能会受到系统默认主题设置的影响
在抓取推文时遇到了这个问题。 获取适合您系统的最新 Chrome 用户代理并提供窗口大小。
chrome_options.add_argument('--headless')
chrome_options.add_argument("--window-size=1920x1080")
user_agent = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36'
chrome_options.add_argument('user-agent={0}'.format(user_agent))