Получение содержимого веб-страницы, похожего на Readability как сервис - PullRequest
2 голосов
/ 14 марта 2012

Я ищу средство для получения чистого HTML-контента для разных страниц (статьи блога, журналы и т. Д.).Основная идея заключается в том, как работает «Читатель» в iOS Safary.

Этот ответ Я могу доказать, что iOS Safary использует Читаемость для анализа содержимого.К сожалению, API не включает в себя какие-либо методы синтаксического анализа, вместо этого сохранение закладки и получение ее содержимого, что меня мало устраивает.

Другой ответ здесь предлагаетиспользуйте https://www.readability.com/api/content/v1/parser, но у меня это не работает.

Есть предложения для подобных сервисов?

1 Ответ

0 голосов
/ 06 ноября 2012

Взгляните на Спокойствие . Это дополнение к Firefox, так что вы можете посмотреть на источник. Вы можете скачать XPI и распаковать его. Затем загляните в content / tranquility.js и связанные файлы в content /.

...