Как обновить тег «часть речи» spaCy фразами, которые содержат более 1 слова, но целая фраза имеет только 1 тег?
Когда я токенизирую фразу за словом, Python выдает ошибку «IndexError: list index out of range», возможно, из-за того, что количество слов не соответствует количеству тегов. Кажется, что это нормально для отображения один-к-одному, но не работает для многих один-единственный.
Например:
"легкая боль" -> Adj, существительное (ок)
«Болезнь Аперта-Крузона» → Существительное (выдает ошибку)
Итак, мне интересно, есть ли способ достичь этого или у кого-нибудь есть интересный обходной путь?