Разбор HTML в Android - PullRequest
       22

Разбор HTML в Android

1 голос
/ 28 января 2011

Я пытаюсь научиться разбирать HTML, но, поскольку у меня нет большого опыта работы с Java или Android, это немного сложно.Я прочитал учебник по синтаксическому анализу IBM XML и научился анализировать RSS-канал.Моя проблема: я хотел бы получить данные с сайта HTML.Я прочитал некоторую информацию о HTML Cleaner, JSON и т. Д., Но я не могу найти хороший учебник, чтобы помочь мне.У вас есть какие-нибудь учебники, которые могут быть полезны?

Спасибо.

Ответы [ 2 ]

0 голосов
/ 28 января 2011

Проверьте следующие HTML-парсеры.Есть больше там.Может быть, вам подойдет:

0 голосов
/ 28 января 2011

IMO существует два простых способа анализа HTML:

  • Преобразование HML в XML (XHTML) с использованием библиотеки (например, HTMLTidy), а затем использование синтаксического анализатора XML
  • Использованиесуществующий анализатор HTML (например, стандартный веб-браузер, такой как WebKit, ForeFox и / или IE), а затем прочитайте «DOM», которое является более-менее-дружественным для API представлением проанализированного HTML

В качестве альтернативы, если вы хотите написать свой собственный синтаксический анализатор (что, я сомневаюсь, вам следует сделать для домашней работы: было бы долго и сложно реализовать его должным образом / полностью), см. Спецификации для анализа HTML .

...