Файл Paragram_300_SL999 Word Embeddings поврежден? - PullRequest
0 голосов
/ 28 февраля 2020

Мне нужно использовать вложения Paragram_SL999_300 для моего проекта, который использует открытый исходный код из опубликованной статьи (https://github.com/cecilialeiqi/adversarial_text). Когда я пытаюсь запустить Шаг 4 (сгенерировать состязательные примеры) из https://github.com/cecilialeiqi/adversarial_text, я получаю ValueError, говоря, что int () ожидаемый, но получил ','. Из readme.txt для Paragram-SL999 300 я знаю, что предполагается, что это будет один токен на строку, за которой следуют его вложения. При попытке открыть файл Paragram_SL999_300.txt, чтобы увидеть, соответствует ли он этим критериям, он загружается примерно наполовину, а затем закрывает TextEditor, не позволяя мне его редактировать. Кроме того, происходит сбой LibreOffice, если я пытаюсь открыть его там. Это было в виртуальной машине Ubuntu 18.04. Однако я не был уверен, что это произошло из-за неправильного кода автора (в discrete_attack.py на https://github.com/cecilialeiqi/adversarial_text/blob/master/src/discrete_attack.py) или из-за того, что файл поврежден, поэтому я попытался загрузить и извлечь архив Paragram-SL999 300 с веб-сайта Wieting (http://www.cs.cmu.edu/~jwieting/) на моем компьютере Windows я получаю сообщение о том, что архив поврежден, что не позволяет мне извлечь файл Paragram_SL999_300.txt и использовать его. На другом компьютере Windows я получаю код ошибки 0x80004005: неуказанная ошибка при попытке извлечь архив.

Есть ли способ обойти эту проблему или кто-нибудь, кто может предоставить информацию об этом? Было бы рекомендовано вместо этого производить вложения из GitHub Wieting (https://github.com/jwieting/paragram-word)? Я был бы очень признателен за любой вклад, так как эти вложения имеют первостепенное значение для моего проекта.

1 Ответ

0 голосов
/ 08 марта 2020

Мне удалось скачать его по ссылке с диска Google на https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fdrive.google.com%2Ffile%2Fd%2F0B9w48e1rj-MOck1fRGxaZW1LU2M%2Fview%3Fusp%3Dsharing&data=02%7C01%7C%7C36fd021bae0343bbe54408d7bdd28c81%7C1faf88fea9984c5b93c9210a11d9a5c2%7C0%7C0%7C637186584305548961&sdata=PouX2kyBlnQHpzAaDKjqe7gFC3ctti6tjBcGWt8pg1s%3D&reserved=0. В конце концов это сработало, но я не уверен, почему в другой раз я не смог заставить его работать. Кроме того, я не осознавал, что для имеющегося кода мне также нужно было добавить размер словаря и размер вложения в первой строке файла (1703756 300).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...