Как извлечь текст из текстовых узлов через Selenium? - PullRequest
0 голосов
/ 07 сентября 2018

У меня есть один HTML-код, из которого я хочу получить текст, но почти тексты не входят ни в какие HTML-теги.

Html

<div class="div-estro">
    <b class="">Your</b> 
    <b class="">ID:</b>&nbsp;3915 
    <b class="">Time Limit:</b>&nbsp;00:19:56 
    <b class="">IP:</b>&nbsp;123.101.59.87 
    <b class="">Membership Period:</b>&nbsp;8 year <br>
    <b class="">CountryID:</b> 78 
    <b class="">Country:</b> US 
    <b class="">State:</b> OH 
    <b class="">City:</b> Akron 
    <b class="">Status:</b> Available 
    <b class="">Maximum Queue:</b> 4 
    <b class=""><br>CountryProxy:</b> 201.250.101.84:3372 
    <b class="">CountryIP:</b> 59.243.44.192 
</div>

Я хочу получить текст от CountryIP и CountryProxy.

Ожидается строка gettext: 201.250.101.84: 3372

Ожидается строка gettext: 59.243.44.192

Я пробовал xpaths:

//div[@class='div-estro']//text()[12]

//div[@class='div-estro']//text()[13]

Выше xpaths кажется хорошим, когда я оцениваю с помощью firebug. Но при попытке получить текст с использованием селена я получаю исключение.

Ответы [ 2 ]

0 голосов
/ 07 сентября 2018

Вы можете использовать XPath для получения необходимых текстовых узлов, как показано ниже:

String countryProxy = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryProxy:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
String countryIP = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryIP:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();

Просто обновите предикат для предыдущего узла b, чтобы получить требуемый текст:

b[.='State:']
b[.='Membership Period:']
...
0 голосов
/ 07 сентября 2018

Согласно HTML, которым вы поделились, это текстовый узел , который содержит текст 59.243.44.192 , поэтому для его извлечения вы можете использовать следующее решение:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryIP = ((JavascriptExecutor)driver).executeScript("return arguments[0].lastChild.textContent;", myElement).toString();

Обновление:

Согласно вашему обновлению комментария это текстовый узел, который содержит текст 201.250.101.84: 3372 , поэтому для его извлечения вы можете использовать следующее решение:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryProxy = ((JavascriptExecutor)driver).executeScript("return arguments[0].childNodes[24].textContent;", myElement).toString();
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...