У меня есть веб-сервис, похожий на digg, который вкратце объясняет, что имеет парсер страниц, и когда люди отправляют истории, парсер возвращает заголовок и сводку на основе hpricot и некоторых других небольших принципов извлечения, которые я написал.Поднимите его на следующий уровень и попробуйте поиск и извлечение контента со страниц, которые пользователи отправляют в анализатор.Я хочу извлечь содержание статьи, например.
Конечно, я действительно не хочу начинать с нуля и писать свой собственный шаблон и алгоритмы извлечения.
Есть лидрагоценный камень или что-то, что я могу подключить к своему приложению rails, которое может в какой-то степени иметь отношение к тому, чего я хочу достичь?
Я действительно застрял в этом, и любая помощь приветствуется.
С наилучшими пожеланиями.