我有一个HTML代码,我想从中获取文本但几乎文本不在任何HTML标记内。
HTML
<div class="div-estro">
<b class="">Your</b>
<b class="">ID:</b> 3915
<b class="">Time Limit:</b> 00:19:56
<b class="">IP:</b> 123.101.59.87
<b class="">Membership Period:</b> 8 year <br>
<b class="">CountryID:</b> 78
<b class="">Country:</b> US
<b class="">State:</b> OH
<b class="">City:</b> Akron
<b class="">Status:</b> Available
<b class="">Maximum Queue:</b> 4
<b class=""><br>CountryProxy:</b> 201.250.101.84:3372
<b class="">CountryIP:</b> 59.243.44.192
</div>
我想从CountryIP和CountryProxy获取文本。
期待gettext字符串:201.250.101.84:3372
期待gettext字符串:59.243.44.192
我试过xpaths:
//div[@class='div-estro']//text()[12]
//div[@class='div-estro']//text()[13]
当我使用firebug进行评估时,上面的xpath似乎很好。但是当试图使用selenium获取文本时,我得到了例外。
根据您共享的HTML,它是一个包含文本59.243.44.192的文本节点,因此要提取它,您可以使用以下解决方案:
WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryIP = ((JavascriptExecutor)driver).executeScript("return arguments[0].lastChild.textContent;", myElement).toString();
更新:
根据您的评论更新,它是一个包含文本201.250.101.84:3372的文本节点,因此要提取它,您可以使用以下解决方案:
WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryProxy = ((JavascriptExecutor)driver).executeScript("return arguments[0].childNodes[24].textContent;", myElement).toString();
您可以使用XPath获取所需的文本节点,如下所示:
String countryProxy = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryProxy:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
String countryIP = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryIP:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
只需更新前面的b
节点的谓词以获取所需的文本:
b[.='State:']
b[.='Membership Period:']
...