Официальный набор данных, предоставленный в Microsoft Visual Story, в котором говорится о проблеме ( visionandlanguage.net / VIST / dataset.html ), содержит не все изображения должным образом.Некоторые повреждены, а некоторые - пустые файлы.Повлияет ли их удаление на точность модели или сопоставление ее с созданным точным сюжетом, поскольку я буду использовать этот рассказ по порядку?Если мне нужно получить источник изображения на основе имени, есть ли место, где я мог бы получить исходный файл на основе текущего имени изображения?Я планирую использовать весь набор данных вместо части набора данных .. Надеюсь, это правильное место, чтобы задать этот вопрос ..