如何通过Python中的Selenium从相对于多个分隔符动态更改的字符串中检索子字符串

问题描述 投票:1回答:1

我想知道是否有可能删除部分刮下的字符串:

Wujek Drew / Uncle Drew

Uncle Drew

当然,由于它是网页抓取,标题每次都会有所不同,所以我可以在这里做些什么来获得上面的结果呢?


更新

我忘了添加一些需要删除的东西。 Wujek Drew / Uncle Drew(2018)我将需要删除字符串末尾的数据。

python selenium selenium-webdriver web-scraping split
1个回答
1
投票

要删除由/字符分隔的刮取字符串的第一部分,可以使用以下解决方案:

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1] 

根据您的评论更新,如果您想从字符串Wujek Drew / Uncle Drew(2018)中提取子字符串Uncle Drew,您可以使用以下解决方案:

import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])
© www.soinside.com 2019 - 2024. All rights reserved.