Я пытаюсь измерить семантическое сходство некоторых понятий в строительной отрасли (задачи или действия в проектах).Для этой цели я использую wordnet
, реализованный в NLTK
.Проблема в том, что наиболее частые synsets
, которые используются для измерения сходства слов, не относятся к этой области.
>>> wn.synsets('reinforcement')[0].definition
a military operation...
, но смысл, который я хочу сфокусировать, относится к другому synset
,
>>> wn.synsets('reinforcement')[3].definition()
a device designed to provide additional strength
Мой вопрос таков: есть ли способ изменить, какой корпус wordnet
использует для определения частоты synsets
- корпуса, больше связанного со строительством?