Что лучше? OpenCyc или ConceptNet? - PullRequest
11 голосов
/ 15 апреля 2010

Я делаю проект НЛП, где мне нужно распознавать понятия в предложениях, чтобы найти другие похожие понятия. Я делаю это, чтобы вывести слово валентности из списка, который у меня уже есть. Я начал использовать WordNet, но он дал много противоречивых результатов. Под противоречивыми результатами я подразумеваю расширения слов, которые имели противоречивые валентности.

Так что теперь я изучаю ConceptNet и OpenCyc. Я уже внедрил ConceptNet, и все было очень просто, и мне это нравится. Проблема в том, что OpenCyc, похоже, имеет гораздо большую и более логически жесткую базу данных, что важно, когда я обнаружил так много «противоречий» в WordNet ... Но я бы не знал, потому что я не пробовал.

Может кто-нибудь сказать мне, стоит ли предпринимать (значительные для меня) усилия по внедрению OpenCyc, или достаточно ли ConceptNet для определения валентности слов? Они такие разные?

Я буду рад объяснить, если понадобится. Попытка сделать это коротким сейчас!

Спасибо!

1 Ответ

8 голосов
/ 09 января 2012

Это не стоит усилий. ConceptNet намного лучше и с ним легче иметь дело.

Когда я использовал ConceptNet, нужно было загрузить базу данных sqlite и модуль python для доступа к связям в ней. Для OpenCyc это была большая загрузка, и ее нужно было настраивать через веб-сервер, который загружался целую вечность и использовал огромное количество памяти. С тех пор все могло измениться, но это был мой опыт.

...