Английский CoNLL17 корпус № 144 - это тот, который я пытаюсь прочитать.Однако страница помощи вики не очень помогает мне.
Я попытался добавить код на странице справки вики.Я скачал файл корпуса и сохранил его локально.Однако это не zip-файл, поэтому я сжал его обратно в zip-файл, и при попытке прочитать данные он выдаст ошибки, которые zip-файлы не будут повторяемыми.
import zipfile
import gensim
repository = "/projects/nlpl/data/vectors/11"
with zipfile.ZipFile(repository + "/30.zip", "r") as archive:
stream = archive.open("model.txt")
for line in stream:
...
Я ожидал, что файл будет читабелен на их примере.Я попытался просто прочитать файл, но безуспешно.Я хочу попробовать сравнить разные слова и увидеть их векторы.