Что-нибудь лучше, чем рубиновая алхимия для извлечения ключевых слов? - PullRequest
7 голосов
/ 09 августа 2010

В настоящее время я написал в Ruby алгоритм на основе читабельного кода arc90 для извлечения статьи с веб-страницы.

Теперь, когда у меня есть статья, я хочу извлечь из нее ключевые слова и конкретную информацию(имена, автор и т. д.)

Я слышал, что Алхимия была отличным сокровищем рубина для этого, хотя она потребляет много ресурсов.Есть ли лучшие камни, которые я могу использовать для этого?

Ответы [ 2 ]

9 голосов
/ 26 августа 2012

быстрый, легкий и простой в использовании гем для извлечения ключевых слов из более длинного контента:

https://rubygems.org/gems/highscore

Я использую его в производстве, работает как шарм.

Вопрос немного старше, но я оставлю это здесь для тех, кто придет из Google, чтобы увидеть этот вопрос.

2 голосов
/ 01 октября 2010

Существует OpenCalais gem , который предоставляет аналогичные возможности.В дополнение к извлечению сущностей он также может обнаруживать события и отношения между сущностями.Это не легкий, хотя я не мог сказать, лучше это или хуже, чем Алхимия, поскольку я не использовал драгоценность Алхимии.Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...