Текстовый майнинг в C # - PullRequest
       8

Текстовый майнинг в C #

0 голосов
/ 18 января 2012

Существует ли библиотека C # с открытым исходным кодом для анализа текста и его классификации по категориям, позволяющая настраивать его на разные языки.

Я ожидаю фазы обучения от библиотеки, которая создает векторное пространство из слов и указывает, какое слово является, например, Человеком или Организацией или Местом и т. Д. И на основе созданной базы данных распознает и извлекает основную характеристику текста.

1 Ответ

1 голос
/ 18 января 2012

Если вы имеете в виду предложения / слова / фразы / и т. Д., Есть служба, которую вы можете позвонить ... opencalais.com, она пытается идентифицировать объекты в тексте. Кроме того, вы можете захотеть взглянуть на инструментарий естественного языка .. nltk.org .. надеюсь, это поможет .. также вы можете найти больше того, что ищете, используя «интеллектуальный анализ данных»

...