Мне нужно использовать вложения Paragram_SL999_300 для моего проекта, который использует открытый исходный код из опубликованной статьи (https://github.com/cecilialeiqi/adversarial_text). Когда я пытаюсь запустить Шаг 4 (сгенерировать состязательные примеры) из https://github.com/cecilialeiqi/adversarial_text, я получаю ValueError, говоря, что int () ожидаемый, но получил ','. Из readme.txt для Paragram-SL999 300 я знаю, что предполагается, что это будет один токен на строку, за которой следуют его вложения. При попытке открыть файл Paragram_SL999_300.txt, чтобы увидеть, соответствует ли он этим критериям, он загружается примерно наполовину, а затем закрывает TextEditor, не позволяя мне его редактировать. Кроме того, происходит сбой LibreOffice, если я пытаюсь открыть его там. Это было в виртуальной машине Ubuntu 18.04. Однако я не был уверен, что это произошло из-за неправильного кода автора (в discrete_attack.py на https://github.com/cecilialeiqi/adversarial_text/blob/master/src/discrete_attack.py) или из-за того, что файл поврежден, поэтому я попытался загрузить и извлечь архив Paragram-SL999 300 с веб-сайта Wieting (http://www.cs.cmu.edu/~jwieting/) на моем компьютере Windows я получаю сообщение о том, что архив поврежден, что не позволяет мне извлечь файл Paragram_SL999_300.txt и использовать его. На другом компьютере Windows я получаю код ошибки 0x80004005: неуказанная ошибка при попытке извлечь архив.
Есть ли способ обойти эту проблему или кто-нибудь, кто может предоставить информацию об этом? Было бы рекомендовано вместо этого производить вложения из GitHub Wieting (https://github.com/jwieting/paragram-word)? Я был бы очень признателен за любой вклад, так как эти вложения имеют первостепенное значение для моего проекта.