Как обновить тег «часть речи» spaCy фразами, которые содержат более 1 слова, но у всей фразы есть только 1 тег? - PullRequest
2 голосов
/ 19 июня 2019

Как обновить тег «часть речи» spaCy фразами, которые содержат более 1 слова, но целая фраза имеет только 1 тег?

Когда я токенизирую фразу за словом, Python выдает ошибку «IndexError: list index out of range», возможно, из-за того, что количество слов не соответствует количеству тегов. Кажется, что это нормально для отображения один-к-одному, но не работает для многих один-единственный.

Например:

"легкая боль" -> Adj, существительное (ок)

«Болезнь Аперта-Крузона» → Существительное (выдает ошибку)

enter image description here

Итак, мне интересно, есть ли способ достичь этого или у кого-нибудь есть интересный обходной путь?

...