Как получить значение внутри тега <td>с помощью xpath / htmlwebunit - PullRequest
5 голосов
/ 28 февраля 2012

Я пытаюсь создать приложение Java, которое получает информацию с веб-страницы.Это часть кода, я пытаюсь получить доступ к значению в 1-м теге td во 2-м теге tr:

<TABLE  CLASS="datadisplaytable" width = "100%">
<TR>
    <TD CLASS="dddead">&nbsp;</TD>
    <TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Capacity</SPAN></TH>
    <TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Actual</SPAN></TH>
    <TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Remaining</SPAN></TH>
</TR> 
<TR>
    <TH CLASS="ddlabel" scope="row" ><SPAN class="fieldlabeltext">Seats</SPAN></TH>
    **<TD CLASS="dddefault">46</TD>**
    <TD CLASS="dddefault">46</TD>
    <TD CLASS="dddefault">0</TD>
</TR>

Это то, что у меня есть сейчас, но это только возвращает класс тега tdа не значение внутри него:

List<?> table = page.getByXPath("//table[@class='datadisplaytable'][1]//tr[2]/td");

Как мне получить значение тега td, а не его свойства?

edit: приведенный выше код возвращает это:

HtmlTableDataCell[<td class="dddefault">]

Ответы [ 2 ]

7 голосов
/ 28 февраля 2012

Я пытаюсь создать приложение Java, которое получает информацию с веб-страницы. Это часть кода, я пытаюсь получить доступ к значению в 1-м теге td во 2-ом теге tr:

Предполагая, что документ соответствует указанному в вопросе (TABLE является верхним элементом),

Используйте

/TABLE/TR[2]/TD[1]/text()

Выбирает любой дочерний элемент текстового узла первого TD дочернего элемента второго TR дочернего элемента верхнего элемента TABLE.

Если таблица скрыта в XML-документе, но может быть однозначно идентифицирована по атрибуту CLASS, используйте :

//TABLE[@CLASS='datadisplaytable']/TR[2]/TD[1]/text()

Это выбирает любой дочерний элемент текстового узла первого TD дочернего элемента второго TR дочернего элемента любого (мы знаем, что это только один такой) элемент TABLE в документе XML, так что строковое значение атрибут CLASS - это строка 'datadisplaytable'.

Наконец, , если еще хуже, может быть много элементов TABLE, значение атрибута которых CLASS равно 'datadisplaytable', и мы хотим выбрать в первой такой таблице использование:

(//TABLE[@CLASS='datadisplaytable'])[1]/TR[2]/TD[1]/text()
1 голос
/ 02 апреля 2012
for getting the text content from an element there is an xpath function called "text()" which you can use.

Element containing text 't' exactly         //*[.='t']  
Element <E> containing text 't'             //*[.='t']  
<a> containing text 't'                     //a[contains(text(),'t')]
<a> with target link 'url'                  //a[@href='url']
Link URL labeled with text 't' exactly      //a[.='t']/@href

Если вы также используете JwebUnit, есть метод "getElementTextByXPath", который также можно использовать для получения текста. net.sourceforge.jwebunit.junit.WebTestCase

getElementTextByXPath

public String getElementTextByXPath (String xpath) устарело.Получить текст данного элемента.Параметры: xpath - xpath элемента.

    for (int i = 1; i != 6; i++) {

        String result = getElementTextByXPath("//td["+i+"][text()]");

        System.out.println("The Content of TD is " +result);
    }
...