По умолчанию Spacy применяет к вашему документу множество моделей: POS tagger, синтаксический анализатор c, NER, классификатор документов и, возможно, что-то еще.
Возможно, вам не нужны некоторые из них модели. Если это так, вы можете отключить их, что ускорит ваш конвейер. Вы делаете это при создании конвейера, например:
nlp = spacy.load('en_core_web_sm', disable=['ner', 'parser'])
Или, следуя ответу @ oleg-ivanytskiy, вы можете отключить эти модели в вызове nlp.pipe()
:
nlp = spacy.load("en_core_web_sm")
for doc in nlp.pipe(texts, disable=["tagger", "parser"]):
# Do something with the doc here
print([(ent.text, ent.label_) for ent in doc.ents])