Категоризация слов и значений категорий - PullRequest
12 голосов
/ 04 июня 2009

Сегодня в классе нам поставили задачу алгоритма, как «если вы найдете решение, вам не нужно заниматься этим предметом». ТАК конечно, мы все думали, что попробуем.

В основном нам была предоставлена ​​БД из 100 слов и 10 категорий. Нет совпадения между словами или категориями. Так что это в основном список из 100 слов и 10 категорий.

Мы должны «поместить» слова в правильную категорию, то есть мы должны «выяснить», как поместить слова в правильную категорию. Таким образом, мы должны «понять» слово, а затем поместить его в наиболее подходящую категорию.

т.е. одно из слов «рыбалка» категории «спорт» -> так что это будет в эту категорию. Между словами и категориями существует некоторое совпадение, поэтому некоторые слова могут входить в несколько категорий.

Если мы выясним это, мы должны увеличить размер выборки, и победит человек с «лучшим» соответствием%.

У кого-нибудь есть идеи, как начать что-то подобное? Или какие-нибудь ресурсы? Желательно в C #?

Даже ключевое слово DB или что-то может быть полезным? Кто-нибудь знает какие-нибудь бесплатные?

Ответы [ 21 ]

0 голосов
/ 04 июня 2009

Используйте (в Интернете или загрузите) WordNet и найдите количество взаимосвязей между словами и каждой категорией, которым вы должны следовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...