Понимание / изменение оценки синсета в Wordnet - PullRequest
0 голосов
/ 12 марта 2020

Сравнение документов с использованием синтаксиса в работе dnet в python. Документы говорят о спорте. При сравнении футбола (футбол для друзей, которые предпочитают) с крикетом.

Сравнение 1:

Synset('game.n.01') - Synset('cricket.n.01') : 0.05555555555555555
Synset('game.n.01') - Synset('football.n.01') : 0.2

Большое несоответствие. Вероятно, synset не распознает крикет как игру.

Сравнение 2:

Synset('play.v.01') - Synset('cricket.n.01') : 0.06666666666666667
Synset('play.v.01') - Synset('football.n.01') : 0.07692307692307693

Меньшее несоответствие. Все же крикет, кажется, не связан с чем-то, что играется

Почему это неравенство? Что более важно, как мы можем изменить это? Есть ли еще один 'wor dnet', который мы можем использовать?

...