Сравнение документов с использованием синтаксиса в работе dnet в python. Документы говорят о спорте. При сравнении футбола (футбол для друзей, которые предпочитают) с крикетом.
Сравнение 1:
Synset('game.n.01') - Synset('cricket.n.01') : 0.05555555555555555
Synset('game.n.01') - Synset('football.n.01') : 0.2
Большое несоответствие. Вероятно, synset не распознает крикет как игру.
Сравнение 2:
Synset('play.v.01') - Synset('cricket.n.01') : 0.06666666666666667
Synset('play.v.01') - Synset('football.n.01') : 0.07692307692307693
Меньшее несоответствие. Все же крикет, кажется, не связан с чем-то, что играется
Почему это неравенство? Что более важно, как мы можем изменить это? Есть ли еще один 'wor dnet', который мы можем использовать?