Как получить POS-теги для объединенных фраз из Spacy? - PullRequest
1 голос
/ 15 апреля 2020

В настоящее время я работаю над проблемой НЛП, где POS-тегирование является одним из важных шагов. Я использовал Stanford CoreNLP для этой задачи, пока не наткнулся на spaCy. Я новичок в spaCy и играю с его онлайн-демонстрацией на Explosion-Demo

Для данного предложения:

"Мое единственное разочарование в 13-дюймовая модель состоит в том, что они единственные в линейке MacBook Pro без процессора i5 или i7 и двух видеокарт, однако компромисс заключается в том, что вы продлите время автономной работы (около двух часов) . "

Демонстрация обеспечила следующий вывод:

Мое единственное разочарование - NOUN с - ADP модель 13" - NOUN - AUX что - SCONJ они - PRON '- AUX единственные - NOUN в - ADP линия MacBook Pro - NOUN up - ADP без - ADP процессор i5 или i7 - NOUN и - CCONJ двойные видеокарты, - NOUN , однако - ADV компромисс - NOUN - AUX, - SCONJ you - PRON достигают - VERB более длительное время автономной работы (- NOUN из - ADP еще около двух часов). - NOUN

Этот вывод идеально подходит для моего варианта использования, поскольку он правильно помечает словосочетания (полужирные результаты). В демонстрации мы можем сделать это, проверив «слияние пунктуации» и «слияние фраз».

Мне было интересно, возможно ли получить такой же вывод через код? Я провел некоторые исследования по этому вопросу, но пока не нашел ничего полезного. Несколько раз я сталкивался с тем, что вы можете объединять фрагменты на основе их тегов.

Любая помощь или указатели будут высоко оценены!

...