如何从此源代码获取所有页面的页面源?我没有任何“下一个”。可以这样设置吗?当我在第1页上时,该课程是“分页活动”。其他页面具有“分页号”类。当我在第2页上时,第1页上的类别为“寻呼号码”,第2页上的类别为“寻呼活动”,其他页上的类别为“寻呼号码”。我想转到下一页。
<div class = "paging">
<div class = "paging-numbers">
<span class = "paging active">
<a title="ball-page2" href="/ball-page2" class="paging-number">
<a title="ball-page3" href="/ball-page3" class="paging-number">
<a title="ball-page4" href="/ball-page4" class="paging-number">
</div>
也许您应该使用请求(和bs4)来代替Selenium:
import requests
r = requests.get("https://my_site.com" + rest_of_the_link)
print(r.text)
尝试使用此 webDriver.findElement(By.xpath(“ // a [@href ='/ ball-page2']”))。click();
xpath将尝试找到提到的URL,如果存在,它将单击该URL。
首先,您可以从所有分页链接中获取href
值并存储在列表中。稍后迭代该列表并执行您的活动。
driver.get("https://www.testsite.com/")
allpagesurl=[item.get_attribute("href") for item in driver.find_elements_by_css_selector(".paging-numbers .paging-number")]
for url in allpagesurl:
driver.get(url)
#Perform your activity on each page