Кто-нибудь знает о каких-нибудь хороших библиотеках для .NET, которые могли бы помочь вытащить ключевые слова из блоков естественного языка.
Я в основном пытаюсь удалить стоп-слова и игнорировать времена, множественное число и вообщенайти слова, которые по сути одинаковы.
Было бы неплохо найти некоторые синонимы, особенно если они включают такие слова, как бизнес / технологии / не словарные слова.