从项目问题描述中提取文本的 Selenium 代码

问题描述 投票:0回答:1

我正在尝试使用Python中的selenium从gitee中提取问题内容。但当我尝试提取文本时它给出空白。这是检查元素:

我想提取 div 类 git-issue-description markdown 正文中的所有文本。

但是当我尝试使用以下代码提取它时,它不起作用:

Issue_description = driver.find_element(By.CLASS_NAME,'git-issue-description markdown-body').text

我应该做些什么来获取这个 div 类中的内容?这是我尝试从中提取文本的网站的链接 - https://gitee.com/openharmony/arkui_ace_engine/issues/I92R3M?from=project-issue

python python-3.x selenium-webdriver
1个回答
1
投票

使用

By.CSS_SELECTOR
"div.git-issue-description.markdown-body"
作为选择器:

print(driver.find_element("css selector", "div.git-issue-description.markdown-body").text)

这是完整的 SeleniumBase 脚本:

from seleniumbase import Driver

driver = Driver()
driver.get("https://gitee.com/openharmony/arkui_ace_engine/issues/I92R3M?from=project-issue")
print(driver.find_element("css selector", "div.git-issue-description.markdown-body").text)
driver.quit()

请注意,

By.CLASS_NAME
只能包含单个类名段,不允许有空格。 (你的是
'git-issue-description markdown-body'
,它有 2 个类名/包含一个空格。)

© www.soinside.com 2019 - 2024. All rights reserved.