我尝试使用 Selenium 抓取 Glassdoor,部分抓取数据是 Job ID
这是我的代码
try:
job_id = driver.find_element_by_xpath('//ul[contains(@class, "job-search-key")]/li').get_attribute('data-id')
except NoSuchElementException:
job_id = -1
代码成功检索了
data-id
上的值,但不幸的是,所取的数据ID值是相同的,非常感谢您的帮助。谢谢
你的问题不够清楚。
我想您必须从
find_element_by_xpath
更改为 find_elements_by_xpath
才能获取 Web 元素s 的列表,然后迭代该列表以从每个元素中提取 data-id
属性。jobs = driver.find_element_by_xpath('//ul[contains(@class, "job-search-key")]/li')
for job in jobs:
job_id = job.get_attribute('data-id')