Возможно ли сделать размер этой библиотеки меньшего размера? В настоящее время в папке python .36 / site-packages / spacy lang находится папка размером 380 МБ, где я вижу много неиспользуемых языков. Я использую только en, и можно ли как-то установить с pip spacy и загрузить в эту папку только нужный язык?
Есть хорошая работа, чтобы уменьшить размер Spacy для развертываний без серверов, таких как AWS Лямбда: https://github.com/ryfeus/lambda-packs
Помимо сокращения хранилища, они также переместите языковые модели на S3, чтобы ограничить требования к размеру пакета.
Также см. здесь сценарий python для сокращения языков: https://gist.github.com/jshhrrsn/5377b9dd282ef51f5564f1347a7d5aef
Это улучшено в v2.2 +, где данные c, специфичные для языка, были перемещены из основной библиотеки в отдельный пакет. Размер немного зависит от вашей ОС, но должен быть ближе к ~ 50 МБ.