Трабл тренинг Gensim word2vec на НЛТК Браун Корпус - PullRequest
0 голосов
/ 03 ноября 2018

Я пытаюсь обучить Gensim библиотеки word2vec на NLTK Brown Corpus, но возникают проблемы при установке пути к корпусу

Код

from gensim.models import word2vec

sentences = word2vec.BrownCorpus('/nltk_data/corpora/brown')

model = word2vec.Word2Vec(sentences, min_count=1)

Error

FileNotFoundError: [Errno 2] Нет такого файла или каталога: '/ nltk_data / corpora / brown'

Я проверил, данные о коричневом корпусе присутствуют на вышеуказанном пути.

Я знаю, что есть еще один способ обучить Gensim word2vec на NLTK Brown Corpus следующим образом, но я хочу знать, почему вышеуказанный метод не работает

from gensim.models import Word2Vec
from nltk.corpus import brown

sentences = brown.sents()

model = Word2Vec(sentences, min_count=1)

Не стесняйтесь отбрасывать любые мысли

...