Библиотека обработки естественного языка для автоматической пометки (.NET) - PullRequest
6 голосов
/ 07 декабря 2010

Кто-нибудь знает о каких-нибудь хороших библиотеках для .NET, которые могли бы помочь вытащить ключевые слова из блоков естественного языка.

Я в основном пытаюсь удалить стоп-слова и игнорировать времена, множественное число и вообщенайти слова, которые по сути одинаковы.

Было бы неплохо найти некоторые синонимы, особенно если они включают такие слова, как бизнес / технологии / не словарные слова.

1 Ответ

4 голосов
/ 20 января 2011

Я давно искал хорошую библиотеку авто-тегов.Я не нашел такой, которая бы обладала всеми необходимыми функциями, но для создания основных текстовых сводок и списков ключевых слов порт C # OpenTextSummarizer не так уж и плох

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...