OSError: [E050] Не удается найти модель de. Это не похоже на ярлык, пакет Python или действительный путь к каталогу данных - PullRequest
1 голос
/ 09 июля 2020

Итак, я пытаюсь создать модель seq to seq для перевода немецкого на английский sh с помощью pytorch в онлайн-блокноте, таком как блокнот kaggle и google colab

import torch
import torch.nn as nn
import torch.optim as optim
from torchtext.datasets import Multi30k
from torchtext.data import Field, BucketIterator
import numpy as np
import spacy
import random
from torch.utils.tensorboard import SummaryWriter  # to print to tensorboard

Библиотеки импортированы, когда я загружаю набор данных с помощью функция с расширением, как показано ниже,

spacy_ger = spacy.load("de")
spacy_eng = spacy.load("en")

Появляется эта ошибка. : OSError: [E050] Не удается найти модель de. Это не похоже на ярлык, пакет Python или действительный путь к каталогу данных.

Везде объяснение дается для 'en', но не для 'de'. Если кто-нибудь может помочь с этим.

Спецификация:

Пакет: Версия

  • Пространство: 2.3.1

  • pytorch-crf: 0.7.0

  • torch: 1.5.1

  • torchnlp: 0.0.0.1

  • torchtext: 0.4.0

  • torchvision: 0.6.1

  • jupyter-tenorboard: 0.2.0

  • tenorboard: 2.2.2

  • tenorboard-plugin-wit: 1.7.0

Заранее благодарим за помощь.

1 Ответ

1 голос
/ 08 августа 2020

так что после целого месяца, пробуя другие вещи и исследуя проблемы и вопросы, связанные с этим топом c, я нашел способ сделать это,

  import spacy.cli 
  spacy.cli.download("en_core_web_md")

С помощью этого метода вы можете использовать и импортировать любую просторную модель, будь то наборы данных среднего или большего размера, что всегда дает ошибку, если вы пытаетесь импортировать набор данных с использованием spacy.load, потому что это неэффективно для загрузки наборов данных, кроме наборов данных наименьшего или наименьшего размера в Google colab или блокнот Kaggle или любой другой блокнот онлайн.

...