Python Selenium:当浏览器无头时无法通过 xpath 找到元素

问题描述 投票:0回答:6

我正在尝试使用以下代码使用 Python Selenium 登录网站:

import time
from contextlib import contextmanager
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

@contextmanager
def getBrowser(*options):
    chrome_options = Options()
    if options: [chrome_options.add_argument(option) for option in options]
    browser = webdriver.Chrome(chrome_options=chrome_options)
    try:
        yield browser
    finally:
        browser.quit()


with getBrowser() as browser:
    browser.get('https://www.vinted.com/members/notifications')

    time.sleep(20)
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()

它工作得很好,但是当我将

--headless
选项添加到浏览器时,它会引发
NoSuchElementException

错误代码:

with getBrowser('--headless') as browser:
    browser.get('https://www.vinted.com/members/notifications')

    time.sleep(20)
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()

追溯:

Traceback (most recent call last):

  File "<ipython-input-4-fe0834deb137>", line 1, in <module>
    runfile('C:/Users/Alec/vinted test case.py', wdir='C:/Users/Alec')

  File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 705, in runfile
    execfile(filename, namespace)

  File "C:\Users\Alec\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
    exec(compile(f.read(), filename, 'exec'), namespace)

  File "C:/Users/Alec/vinted test case.py", line 27, in <module>
    browser.find_element_by_xpath('//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span').click()

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 354, in find_element_by_xpath
    return self.find_element(by=By.XPATH, value=xpath)

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 832, in find_element
    'value': value})['value']

  File "C:\Users\Alec\selenium\webdriver\remote\webdriver.py", line 297, in execute
    self.error_handler.check_response(response)

  File "C:\Users\Alec\selenium\webdriver\remote\errorhandler.py", line 194, in check_response
    raise exception_class(message, screen, stacktrace)

NoSuchElementException: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="content"]/div/div[2]/div/div/div[6]/div[3]/div[3]/a/span"}
  (Session info: headless chrome=65.0.3325.181)
  (Driver info: chromedriver=2.36.540470 (e522d04694c7ebea4ba8821272dbef4f9b818c91),platform=Windows NT 10.0.16299 x86_64)

此错误仅在浏览器无头时发生。是什么导致了这种行为?可以使其在无头模式下工作吗?

目标 HTML:

<div class="u-flex-grow">
      <a class="c-button--inverse c-button--normal c-button--amplified c-button " href="/member/general/login?ref_url=%2Fmembers%2Fnotifications"><span class="c-button__content">Log In</span></a>
    </div>
python selenium-webdriver selenium-chromedriver
6个回答
5
投票

我也有同样的问题。解决方案是添加 usr-agent:

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'
chrome_options.add_argument('user-agent={0}'.format(user_agent))

我通过打印页面找到了原因

browser.get(url)
print(browser.page_source)

然后返回 html 说权限拒绝,所以我用谷歌搜索它。 按照解决方案: 如何通过无头驱动程序访问站点而不被拒绝许可


2
投票

我曾经在使用此类工具的版本时遇到过一些麻烦。我通过确保安装了最新版本的 Chrome 和 webdriver 解决了这个问题。也许这是一个类似的问题?

但除此之外,您的选择器还取决于很多元素。因此,想象 html 在无头模式下看起来有点不同可能会导致您的问题。

我会尝试获得一个不太严格的选择器,如下所示:

//a[starts-with(@href,'/member/general/login?')]

如果这不起作用,请尝试在无头模式下将 html 转储到文件中。只是为了看看无头浏览器看到了什么,并尝试用它构建一个奇特的选择器。


2
投票

我也有同样的问题。解决方案是提供窗口大小:

chrome_options.add_argument("--window-size=1920x1080")

1
投票

当我在 python 代码中添加 --headless 时,我遇到了同样的问题。 我使用ActionChains

解决了这个问题
from selenium.webdriver import ActionChains

text_list = browser.find_elements_by_xpath("//div[@class='tab-content']")
ActionChains(browser).click(text_list).perform()

0
投票

我遇到了类似的问题,直到我意识到某些元素类会根据

theme of the website
而改变。在意识到之前,我已经在页面处于黑暗模式时定义了 css 选择器和 xpath。当无头运行时,页面将处于轻型模式(通过保存屏幕截图知道)。我保存了整个 html 源代码,在检查它时,我发现一些类发生了变化,因此一些 css 选择器和 xpath 失败了。我所做的是创建一个单独的 chrome 配置文件,并从该配置文件中将网站的主题更改为浅色模式。然后我重新定义了我的 css 选择器和 xpath,将此配置文件设置为我的机器人,一切都按预期工作。

浏览器的默认主题可能会受到系统默认主题设置的影响


0
投票

在抓取推文时遇到了这个问题。 获取适合您系统的最新 Chrome 用户代理并提供窗口大小。

chrome_options.add_argument('--headless')
chrome_options.add_argument("--window-size=1920x1080")
user_agent = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36'
chrome_options.add_argument('user-agent={0}'.format(user_agent))
© www.soinside.com 2019 - 2024. All rights reserved.