Как получить таблицы HTML, используя xpath в c? - PullRequest
0 голосов
/ 15 октября 2010

Я использую libxml2 в моем проекте c. Мне было интересно, как я могу получить все таблицы в HTML-файл, используя xpath. Пример кода сделает свое дело.

Мне нужно проанализировать данные в HTML-таблице.

Спасибо

EDIT:

Это строка таблицы:

<tr class="report-data-row-even">
    <td class="NormalTxt report-data-cell report-data-column-even">
        <nobr>0.0285</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-odd">
        <nobr>&#1508;&#1512;&#1496;&#1504;&#1512;</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-even">
        <nobr>SMS</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-odd">
        <nobr>1</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-even">
        <nobr>054-2570130</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-odd">
        <nobr>00:14:09</nobr>
    </td>
    <td class="NormalTxt report-data-cell report-data-column-even">
        <nobr>27/09/2010</nobr>
    </td>
    > 
</tr>

Мне нужно иметь возможность извлекать данные из тегов <nobr>.

Ответы [ 3 ]

1 голос
/ 15 октября 2010

XPath будет просто "// table"

1 голос
/ 15 октября 2010

Ну, мне нужно больше информации.Как выглядит HTML?Какие данные вы извлекаете?И почему С?Хотя создание DOM происходит быстро в C, но впоследствии манипуляции со строками требуют некоторых усилий.Почему не питон?В любом случае вот xpath, который вы могли бы попробовать.

//table[@class='table_class']

Это дает всем таблицам на вашей HTML-странице имя класса как table_class.Вы можете изменить это, чтобы организовать ваш HTML.

0 голосов
/ 18 октября 2010

Для этого вам нужно использовать метод обратного вызова,

для персонажей.

(пустые) символы (Xmlchar *)

см. Документацию libxml

...