如何通过Selenium从文本节点中提取文本?

问题描述 投票:2回答:2

我有一个HTML代码,我想从中获取文本但几乎文本不在任何HTML标记内。

HTML

<div class="div-estro">
    <b class="">Your</b> 
    <b class="">ID:</b>&nbsp;3915 
    <b class="">Time Limit:</b>&nbsp;00:19:56 
    <b class="">IP:</b>&nbsp;123.101.59.87 
    <b class="">Membership Period:</b>&nbsp;8 year <br>
    <b class="">CountryID:</b> 78 
    <b class="">Country:</b> US 
    <b class="">State:</b> OH 
    <b class="">City:</b> Akron 
    <b class="">Status:</b> Available 
    <b class="">Maximum Queue:</b> 4 
    <b class=""><br>CountryProxy:</b> 201.250.101.84:3372 
    <b class="">CountryIP:</b> 59.243.44.192 
</div>

我想从CountryIP和CountryProxy获取文本。

期待gettext字符串:201.250.101.84:3372

期待gettext字符串:59.243.44.192

我试过xpaths:

//div[@class='div-estro']//text()[12]

//div[@class='div-estro']//text()[13]

当我使用firebug进行评估时,上面的xpath似乎很好。但是当试图使用selenium获取文本时,我得到了例外。

java selenium selenium-webdriver xpath webdriver
2个回答
1
投票

根据您共享的HTML,它是一个包含文本59.243.44.192的文本节点,因此要提取它,您可以使用以下解决方案:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryIP = ((JavascriptExecutor)driver).executeScript("return arguments[0].lastChild.textContent;", myElement).toString();

更新:

根据您的评论更新,它是一个包含文本201.250.101.84:3372的文本节点,因此要提取它,您可以使用以下解决方案:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryProxy = ((JavascriptExecutor)driver).executeScript("return arguments[0].childNodes[24].textContent;", myElement).toString();

1
投票

您可以使用XPath获取所需的文本节点,如下所示:

String countryProxy = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryProxy:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
String countryIP = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryIP:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();

只需更新前面的b节点的谓词以获取所需的文本:

b[.='State:']
b[.='Membership Period:']
...
© www.soinside.com 2019 - 2024. All rights reserved.