Извлечение соединений и доби из дерева зависимостей с использованием Spacy - PullRequest
0 голосов
/ 13 мая 2019

Для предложения, такого как: «Заменены и поплавковый выключатель карбонатора, и предохранительный клапан».

Я хотел бы извлечь следующее: {заменен поплавковый выключатель карбонатора}, {заменен предохранительный клапан}

при использовании Spacy для языковой модели мое дерево зависимостей для этого предложения:

enter image description here

Итак, я знаю, что карбонатор - это прямой объект (djob) Замещенного (глагол), но: 1. Карбонатор не сам по себе, но является частью тройного NOUN «Поплавковый выключатель карбонатора», а также заменен «перепускной клапан», они также должны быть направлены на объект замены.

Есть идеи?

1 Ответ

2 голосов
/ 14 мая 2019

Кажется, что проблема не в извлечении соединений из дерева, а в самом разборе: это просто неверно.Возможно, анализатор зависимостей Spacy просто не обучен таким техническим терминам, как «поплавковый выключатель карбонатора» и «предохранительный клапан», и не знает, как они группируются.

Может быть, вам нужно искать другие анализаторы зависимостей (например, Stanford CoreNLP - он выполняет правильный анализ, как показано на рисунке).Или, если вам действительно нужен Spacy, вы можете собирать и маркировать свои собственные обучающие данные и настраивать на них анализатор Spacy.

enter image description here

...