Spacy - создание библиотеки меньшего размера - PullRequest
0 голосов
/ 17 февраля 2020

Возможно ли сделать размер этой библиотеки меньшего размера? В настоящее время в папке python .36 / site-packages / spacy lang находится папка размером 380 МБ, где я вижу много неиспользуемых языков. Я использую только en, и можно ли как-то установить с pip spacy и загрузить в эту папку только нужный язык?

Ответы [ 2 ]

0 голосов
/ 19 февраля 2020

Есть хорошая работа, чтобы уменьшить размер Spacy для развертываний без серверов, таких как AWS Лямбда: https://github.com/ryfeus/lambda-packs

Помимо сокращения хранилища, они также переместите языковые модели на S3, чтобы ограничить требования к размеру пакета.

Также см. здесь сценарий python для сокращения языков: https://gist.github.com/jshhrrsn/5377b9dd282ef51f5564f1347a7d5aef

0 голосов
/ 19 февраля 2020

Это улучшено в v2.2 +, где данные c, специфичные для языка, были перемещены из основной библиотеки в отдельный пакет. Размер немного зависит от вашей ОС, но должен быть ближе к ~ 50 МБ.

...