Я делаю проект НЛП, где мне нужно распознавать понятия в предложениях, чтобы найти другие похожие понятия. Я делаю это, чтобы вывести слово валентности из списка, который у меня уже есть. Я начал использовать WordNet, но он дал много противоречивых результатов. Под противоречивыми результатами я подразумеваю расширения слов, которые имели противоречивые валентности.
Так что теперь я изучаю ConceptNet и OpenCyc. Я уже внедрил ConceptNet, и все было очень просто, и мне это нравится. Проблема в том, что OpenCyc, похоже, имеет гораздо большую и более логически жесткую базу данных, что важно, когда я обнаружил так много «противоречий» в WordNet ... Но я бы не знал, потому что я не пробовал.
Может кто-нибудь сказать мне, стоит ли предпринимать (значительные для меня) усилия по внедрению OpenCyc, или достаточно ли ConceptNet для определения валентности слов? Они такие разные?
Я буду рад объяснить, если понадобится. Попытка сделать это коротким сейчас!
Спасибо!