Невозможно загрузить простую модель en_core_web_lg в Google colab - PullRequest
1 голос
/ 08 июля 2019

Я использую Google Colab для некоторых целей обучения и загрузил модель spaCy 'en_core_web_lg', используя

    import spacy.cli
    spacy.cli.download("en_core_web_lg")

и я получаю сообщение:

    ✔ Download and installation successful
    You can now load the model via spacy.load('en_core_web_lg')

Однако тогда, когда я пытаюсь загрузить модель

    nlp = spacy.load('en_core_web_lg')

выводится следующая ошибка:

    OSError: [E050] Can't find model 'en_core_web_lg'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

Может ли кто-нибудь помочь мне с этой проблемой?

Ответы [ 2 ]

1 голос
/ 09 июля 2019

В colab, использующем ядро ​​Python 3, вы должны быть настроены на запуск в одной ячейке (занимает некоторое время, но дает визуальный отзыв о прогрессе, в отличие от spacy.cli)

!python -m spacy download en_core_web_lg

Затем перезапустите среду исполнения colab (чтобы сделать это в меню colab, перейдите в меню Runtime> Restart runtime ...).

После этого выполняется

import spacy
nlp = spacy.load('en_core_web_lg')

должно работать без нареканий.

0 голосов
/ 09 июля 2019

Я столкнулся с похожей проблемой в Google Colab с:

nlp = spacy.load('en_core_web_md') 

Я подозреваю, что это может иметь отношение к размеру модели. У меня получилось использовать маленькую просторную модель.

spacy download en_core_web_sm
nlp = spacy.load('en_core_web_sm')
...