Я пытаюсь обучить Gensim
библиотеки word2vec
на NLTK
Brown Corpus
, но возникают проблемы при установке пути к корпусу
Код
from gensim.models import word2vec
sentences = word2vec.BrownCorpus('/nltk_data/corpora/brown')
model = word2vec.Word2Vec(sentences, min_count=1)
Error
FileNotFoundError: [Errno 2] Нет такого файла или каталога: '/ nltk_data / corpora / brown'
Я проверил, данные о коричневом корпусе присутствуют на вышеуказанном пути.
Я знаю, что есть еще один способ обучить Gensim word2vec на NLTK Brown Corpus следующим образом, но я хочу знать, почему вышеуказанный метод не работает
from gensim.models import Word2Vec
from nltk.corpus import brown
sentences = brown.sents()
model = Word2Vec(sentences, min_count=1)
Не стесняйтесь отбрасывать любые мысли