Вы должны удалить следующую строку из своего фрагмента кода:
nlp = English()
, поскольку она перезаписывает строку
nlp = spacy.load('en_core_web_sm')
последний en_core_web_sm
имеет предварительно обученный POS-тегер, но English()
- это просто «пустая» модель, в которой нет такого встроенного POS-тегера. Модель en_core_web_sm
также может разбивать предложения, используя анализ зависимостей, поэтому нет необходимости добавлять sentencizer
к нему.