Разница заключается в точности прогнозов.
Но, как вы можете видеть в сравнении в документации spaCy, разница очень мала.
en_core_web_lg
( 788 МБ ) по сравнению с en_core_web_sm
( 10 МБ ) :
- LAS: 90,07% против 89,66%
- POS: 96,98% против 96,78%
- UAS: 91,83% против 91,53%
- NER F-оценка: 86,62% против 85,86%
- NER точность: 87,03% против 86,33%
- NER отзыв: 86,20% против 85,39%
Все это, хотя en_core_web_lg
в 79 раз больше, следовательно, загружается намного медленнее.
Я рекомендую использовать en_core_web_sm
, в то время какразработка, а затем переход к большей модели в производстве.Вы можете легко переключаться, просто меняя загружаемую модель.
nlp = spacy.load("en_core_web_lg")