в праве доступа отказано при чтении файла GoogleNews-vectors-positive300.bin - PullRequest
0 голосов
/ 11 апреля 2019

Я пытаюсь прочитать модели кодирования на разных языках, такие как golve, fasttext и word3vec, и обнаруживаю сарказм, но не могу прочитать файл языковой кодировки Google.Это дает разрешение отказано в ошибке.что мне делать?

Я попробовал другую кодировку и дал все права на файл, но все равно не повезло

EMBEDDING_FILE = 'C:/Users/Abhishek/Documents/sarcasm/GoogleNews-vectors-negative300.bin/'
def get_coefs(word, *arr): return word, np.asarray(arr, dtype='float32')
embeddings_index = dict(get_coefs(*o.rstrip().rsplit(' ')) for o in open(EMBEDDING_FILE,encoding="ISO-8859-1"))
embed_size = 300
word_index = tokenizer.word_index
nb_words = min(max_features, len(word_index))
embedding_matrix = np.zeros((nb_words, embed_size))
for word, i in word_index.items():
    if i >= max_features: continue
    embedding_vector = embeddings_index.get(word)
    if embedding_vector is not None: embedding_matrix[i] = embedding_vector


PermissionError                           Traceback (most recent call last)
<ipython-input-10-5d122ae40ef0> in <module>
      1 EMBEDDING_FILE = 'C:/Users/Abhishek/Documents/sarcasm/GoogleNews-vectors-negative300.bin/'
      2 def get_coefs(word, *arr): return word, np.asarray(arr, dtype='float32')
----> 3 embeddings_index = dict(get_coefs(*o.rstrip().rsplit(' ')) for o in open(EMBEDDING_FILE,encoding="ISO-8859-1"))
      4 embed_size = 300
      5 word_index = tokenizer.word_index

PermissionError: [Errno 13] Permission denied: 'C:/Users/Abhishek/Documents/sarcasm/GoogleNews-vectors-negative300.bin/'

1 Ответ

0 голосов
/ 12 апреля 2019

Вы, вероятно, получите ту же ошибку, связанную с вводом-выводом, независимо от того, как вы пытаетесь или с какой целью вы пытаетесь открыть файл - так что на самом деле это не вопрос nlp, или word2vec, илидаже jupyter-notebook.

Обратите внимание, что иногда ошибки, которые мы рассматриваем как другие, сообщаются как проблемы "разрешения" - потому что на каком-то уровне вы не можете сделать это с этим видом пути или файла.

Вы указали путь к файлу как 'C:/Users/Abhishek/Documents/sarcasm/GoogleNews-vectors-negative300.bin/', с завершающим /, который обычно указывает, что что-то является каталогом.Это может быть проблемой.

Кроме того, я считаю, что этот конкретный файл обычно имеет размер 3+ ГБ - и некоторые файловые системы, происходящие из DOS, или интерпретатор Python, который является только 32-разрядным, могут иметь проблемы с обработкой файловв определенных размерах, например 2 ГБ или 4 ГБ.

...