анализ HTML как строки для получения значений с использованием ключевого слова - PullRequest
0 голосов
/ 07 марта 2011

У меня есть HTML-файл, который читается как строка. Я хочу разобрать это и получить значения, используя <TD colSpan=2>Value : Так что есть около 10 значений, которые я должен получить из HTML-файла .. как я могу это сделать .. я пытаюсь использовать что-то вроде

startindex endindex getsubstring

  sMainBeginKeyword = "<td>Value : ";
  sBeginKeyword = "<td>Value : ";
  sEndKeyword = "</td>";

  main_begin_index = result.indexOf(sMainBeginKeyword);
  while (main_begin_index != -1) {
    begin_index = main_begin_index;
    end_index = result.indexOf(sEndKeyword, begin_index);
    String deloc= result.substring(begin_index + sBeginKeyword.length(), end_index);

Но это выглядит сложно, и я не могу получить больше значений .. Поскольку у меня много значений с разными ключевыми словами ..

1 Ответ

0 голосов
/ 07 июля 2011

Подобные вещи действительно нужно выполнять с использованием синтаксического анализатора XML или DOM: попытка сделать это с помощью поиска строк - это настройка на неудачу.

Если вы загрузили HTML-код в синтаксический анализатор XML или DOM, задача, которую вы пытаетесь выполнить, будет тривиальной, если использовать нотацию XPath для поиска соответствующих элементов.

Вы не указали, над каким языком или платформой вы работаете (и приведенный вами пример кода недостаточен, чтобы быть уверенным в этом), поэтому трудно быть более конкретным.

Надеюсь, это поможет.

...