Как загрузить в папку корпус / zipfile в ноутбуке Jupyter? - PullRequest
0 голосов
/ 06 июня 2019

Английский CoNLL17 корпус № 144 - это тот, который я пытаюсь прочитать.Однако страница помощи вики не очень помогает мне.

Я попытался добавить код на странице справки вики.Я скачал файл корпуса и сохранил его локально.Однако это не zip-файл, поэтому я сжал его обратно в zip-файл, и при попытке прочитать данные он выдаст ошибки, которые zip-файлы не будут повторяемыми.

import zipfile
import gensim
repository = "/projects/nlpl/data/vectors/11"
with zipfile.ZipFile(repository + "/30.zip", "r") as archive:
  stream = archive.open("model.txt")
  for line in stream:
    ...

Я ожидал, что файл будет читабелен на их примере.Я попытался просто прочитать файл, но безуспешно.Я хочу попробовать сравнить разные слова и увидеть их векторы.

...