Извлечение данных HTML из блога Blogspot с телефона Android - PullRequest
0 голосов
/ 27 февраля 2011

Я оглянулся и не могу найти ничего, что могло бы помочь. Вот что я хочу сделать:

  1. Извлечение первого сообщения из
  2. Блог Blogspot Показать на экране

Мне нужно что-то, что будет извлекать данные из определенного тега и идентификатора на HTML-странице. Мне также нужно, чтобы он был совместим с форматом Dalvik, потому что в некоторых библиотеках говорится, что преобразование не удалось, и мое приложение не работает. Было бы хорошо, если бы это было прямо вперед.

Есть предложения?

Ответы [ 3 ]

3 голосов
/ 27 февраля 2011

Используйте HttpClient для получения страницы.Используйте любой из преобладающих парсеров Java HTML для извлечения вашего поста.Если вы нашли нужную библиотеку и получили ошибку «сбой преобразования», возьмите исходный код вместо JAR и добавьте исходный код в свой проект - вы получите конкретные ошибки компиляции, а затем сможете определить, если ониможно отремонтировать.

0 голосов
/ 07 апреля 2012

с помощью Jsoup вы можете анализировать html-данные по файлам, строкам и URL-адресам. он также извлекает данные с тегами и классом http://jsoup.org/cookbook/

0 голосов
/ 27 февраля 2011

Я настоятельно рекомендую попробовать, если вам нужен только текст

http://www.alchemyapi.com/api/text/

Вы можете использовать их Android SDK. Это работает потрясающе! Я тоже использую его для извлечения текста.

...