Вы не должны использовать main_score.py
(для этого требуется рассол fill_in_blank_1000_from_test_score.pkl
), он устарел - только авторы не упоминают об этом в README. Проблема была поднята в эта проблема . Короче говоря, используйте другое «основное»: main_multi_modal.py
.
В одном из комментариев подробно объясняется, как поступить, я скопирую его здесь, чтобы он не потерялся:
- Загрузите предварительно обработанный набор данных от авторов (один на Google Диске, около 7 ГБ)
- Загрузите «обычный» набор данных, чтобы получить текст к изображениям (тот, который на Github - всего несколько МБ)
- Измените все пути к папкам в файлах на соответствующие им
- запустите "onehot_embedding.py", чтобы создать текстовые функции (Остальные обработка уже была сделана авторами)
- запустите "main_multi_modal.py" для обучения. В конце файла вы можете настроить конфигурацию сети (Beta, d, T et c.), Поэтому файл «Config.py» здесь бесполезен.
- Если вы хотите тренироваться В нескольких случаях в for-l oop вам необходимо сбросить график в начале обучения. Просто добавьте «tf.reset_default_graph ()» в начале функции «cm_ggnn ()». С этой настройкой я мог бы довольно хорошо воспроизвести результаты с той же точностью, что и в статье.