有一个我想要卷曲的网站,数据是嵌套和分离的类和元素。 每个页面都有不同数量的这些类和元素。我希望在列表中获取数据,因为每个列表元素都是页面元素数据之一。
这就是我为此所做的:
driver = webdriver.Chrome(chromedriver_path,chrome_options=chrome_options)
driver.get(my_path_to_website)
element = driver.find_element_by_xpath("//div[@class='class1']/*")
driver.execute_script("return arguments[0].textContent;", element)
print(element.text)
但它给了我父类中的所有数据作为字符串,我希望它分开。
这是网站上的HTML形式:
<div class="class1" id="class1">
<div class="b">
<div class="m1">
<p>data1</p>
</div>
<div class="m2">
<p>data2</p>
</div>
</div>
<div class="b">
<div class="m1">
<p>data3</p>
</div>
<div class="m2">
<p>data4</p>
</div>
</div>
.
.
.
</div>
正如我所说,我希望我的数据在列表my_data = ['data 1', 'data 2', 'data 3', 'data 4' , ...]
或dict ...但我的代码,我只是把它作为一个字符串。 my_data = "data 1 data 2 data 3 data 4"