Pos-тег Spacy очень удобен, он может напрямую помечать необработанное предложение.
import spacy
sp = spacy.load('en_core_web_sm')
sen = sp(u"I am eating")
Но я использую токенизатор из nltk
.Так как использовать тегированное предложение типа ['I', 'am', 'eating']
вместо «Я ем» для тегера Spacy?
Кстати, где я могу найти подробную документацию Spacy?Я могу найти обзор только на официальном сайте
Спасибо.