Как автоматически определить теги (ключевые слова) по заданному тексту? - PullRequest
5 голосов
/ 03 февраля 2011

Он должен вести себя как Восхитительная панель инструментов для Firefox; в нем перечислены возможные теги для нажатия. Эффект показан ниже:

enter image description here

Код должен быть в состоянии найти ключевые слова для текста. Какой-нибудь хороший алгоритм или проект с открытым исходным кодом, чтобы рекомендовать?

Я нашел этот пост , но он слишком общий для моей конкретной потребности.

1 Ответ

7 голосов
/ 24 июня 2011

Я думаю, что вы ищете один из этих ответов,

В двух словах - вы 'Мы стремимся извлекать из текста униграммы, которые каким-то образом представляют концепции в нем - метод для этого называется точечной взаимной информацией, которая иллюстрируется примером в первых двух ссылках.Использование инфраструктуры Python NLTK (в которую уже встроена куча этих алгоритмов) может быть вашей лучшей отправной точкой для работы.

Удачи!

...