проанализировать HTML-страницу, введенную в виде строки? (Строка в XML) - PullRequest
0 голосов
/ 03 марта 2011

Я получил это как строку для моего метода prepareXml

<TBODY>
<TR>
<TD colSpan=4>Detail of your Trip</TD></TR>
<TR></TR>
<TR>
<TD colSpan=4>Booking Ref. : XXX</TD></TR>
<TR></TR>
 <TR>
 <TD>Client</TD>
 <TD colSpan=2>Ticket Number</TD>
 <TD>FOID</TD></TR>
 <TR>
 <TD>Person (ADT)</TD>
 <TD colSpan=2>000000</TD>
<TD>XXXX</TD></TR>
 <TR></TR>
  <TR>
 <TD>From: Location 1</TD>
 <TD>To : Location 2</TD>
 <TD colSpan=2>Flight : LLL</TD></TR>
<TR>
<TD colSpan=2></TD>
<TD colSpan=2>Departure : 14Aug, 15:55 Latest check-in time limit : 15:25 </TD></TR>
<TR>
<TD colSpan=2></TD>
<TD colSpan=2>Arrival : 17:25</TD></TR>
<TR>
<TD colSpan=2></TD>
<TD colSpan=2>Class N</TD></TR>
<TR>
<TD>From : Location 2</TD>
<TD>To :Location1</TD>
<TD colSpan=2>Flight : AF2585 Resa : OK</TD></TR>
<TR>
<TD colSpan=2></TD>
<TD colSpan=2>Departure : "Time" Latest check-in time limit : "Time" </TD></TR>
<TR>
<TD colSpan=2></TD>
<TR>
<TD colSpan=2></TD>

Класс N

У меня есть строка, и я должен ее проанализировать и отправить как xml

Я хочу получить номер рейса Номер билета, а также место отправления, место прибытия .. И также проверить, является ли это односторонним или двухсторонним ..

Как я могу это сделать .. Как естьдействительно большой, каков лучший способ разобрать это?

Помощь оценена.

1 Ответ

1 голос
/ 03 марта 2011

Вы можете проанализировать HTML, например, NekoHTML . Neko - это анализатор с открытым исходным кодом / балансировщик тегов, который позволяет вам использовать обычные операции XML для поиска и извлечения информации из вашего документа. Например.,

String html = ...
DOMParser parser = new DOMParser();
parser.parse(new InputSource(new ByteArrayInputStream(html.getBytes())));
Document = parser.getDocument(); // standard org.w3c.dom.Document

На этом этапе вы можете также подключить его к XPATH парсеру, такому как Jaxen , для более удобного извлечения нужной информации.

...