Чтение большего количества RSS-каналов с Java - PullRequest
2 голосов
/ 10 марта 2011

Я пишу небольшое Java-приложение, которое я хочу использовать для поиска в RSS-каналах новостей, которые меня интересуют (меня не волнует, существует ли такое приложение, я пишу его в основном для учебных целей). В настоящее время я использую информацию, которую я нашел здесь, чтобы сделать читателя . Код отличный и все такое, но я столкнулся с проблемой. RSS-каналы, например , например, здесь: относятся только к нескольким последним записям, однако RSS-каналы, такие как Google Reader, отображают всю историю RSS-канала назад, как мне хочется. Как бы я прочитал канал RSS для большего количества записей?

Ответы [ 3 ]

1 голос
/ 10 марта 2011

Вы можете получить только предоставленные данные.

У Google есть история, потому что они опрашивали канал в течение длительного периода времени и сохраняли все статьи, которые когда-либо появлялись в нем.

0 голосов
/ 10 марта 2011

Вы можете просто сойти с ума, так как упомянули учебные цели и используете Nutch для сканирования и индексирования искомого содержимого RSS, на самом деле его довольно легко настроить, если вы работаете в одном узле, не используя кластер Hadoop.Вы также можете использовать Droid для паука контента.

Или просто простой парсер RSS http://www.vogella.de/articles/RSSFeed/article.html#overview_java:)

0 голосов
/ 10 марта 2011

RSS-каналы - это еще один способ форматирования контента в соответствии с согласованным стандартом.Каждый раз, когда ваше приложение запрашивает контент с URL-адреса RSS-канала, веб-сервер обрабатывает этот запрос и возвращает контент (предположительно отформатированный в соответствии со стандартом RSS XML).

Если вы хотите убедиться, что не пропустилилюбые предметы, то вам придется регулярно опрашивать RSS-ленту и вести собственную историю.

...