изменить корпус, который WordNet рассчитывает частоты лемм на основе этого - PullRequest
0 голосов
/ 11 февраля 2019

Я пытаюсь измерить семантическое сходство некоторых понятий в строительной отрасли (задачи или действия в проектах).Для этой цели я использую wordnet, реализованный в NLTK.Проблема в том, что наиболее частые synsets, которые используются для измерения сходства слов, не относятся к этой области.

>>> wn.synsets('reinforcement')[0].definition
a military operation...

, но смысл, который я хочу сфокусировать, относится к другому synset,

>>> wn.synsets('reinforcement')[3].definition()
a device designed to provide additional strength

Мой вопрос таков: есть ли способ изменить, какой корпус wordnet использует для определения частоты synsets - корпуса, больше связанного со строительством?

...