NPM Пакет для реляционной маркировки POS / дерева разбора? (т.е. определить предмет и объект, а не только существительное / глагол / прилагательное) - PullRequest
0 голосов
/ 29 марта 2020

Я работаю над проектом, в котором я очищаю Esports Wiki для трансфера игроков, смены команды и т. Д. c. Я дошел до того, что могу выделить строку типа «Сизз присоединяется к NRG Esports в качестве тренера», и из этой строки я хочу определить игрока, команду и тип события. Формулировка этих строк проста, но не всегда последовательна, например, «команда отбрасывает игрока» или «игрок покидает команду» должна приводить к анализу одного и того же события. Иногда строка также будет содержать несколько событий, поэтому я не смог использовать ключевые слова или что-то в этом роде.

То, что я ищу, это то, что будет принимать предложение и выплевывать анализ дерево с POS-тегами отношения, например:

enter image description here

Или в текстовом виде:

( (IP-MAT (NP-SBJ (PRO I))
  (VP (VBP enjoy)
      (NP-OB1 (N hunting)))
  (PUNC .)))

Где -sbj и - obj - это теги, а не только NP, VP и т. д. c.

spacy-nlp , кажется, делает это, но использует socket.io и Python, которые выглядят как много. CoreNLP выглядит так же многообещающе, так как он использует большой проект CoreNLP, разработанный Стэнфордом, но опять же он использует Java. Компромисс показался действительно хорошим и легким решением, но, хотя он хорошо работает для идентификации существительных / глаголов / прилагательных / et c., Он, похоже, не имеет никакой функциональности для тегирования отношений (субъект и объект).

Я искал несколько часов и сейчас планирую просто переделать весь мой проект в Python, но это кажется достаточно простой задачей, чтобы какое-то решение JS NLP могло бы справиться с этим. Есть указатели?

...