Я использую предварительно обученный классификатор изображений для оценки обработки входных данных. Я загрузил набор данных проверки CLS-LOC ImageNet ILSVRC2014 для использования в качестве базы. Мне нужно знать фактические классы изображений, чтобы оценить мои методы лечения (необходимо определить правильные классификации). В инструментарии 2014 года имеется файл ILSVRC2014_clsloc_validation_ground_truth.txt, который согласно readme должен содержать метки классов (в форме ID: s) для 50 000 изображений в наборе данных. В файле 50 000 записей / строк, так что пока все выглядит хорошо, но я также хочу соответствующие метки / имена семантических классов.
Я нашел их в нескольких местах в Интернете, и они кажутся связными (1000 уроков). Но затем я посмотрел на первое изображение, которое является змеей, основная правда для первого рисунка - 490, 490-я строка в списке семантических имен - «цепочка». Это странно, но все еще близко. Второе изображение - катание на лыжах двух человек, производного класса "хорек". Я пробовал еще много с похожими результатами.
Должно быть, я что-то неправильно понял. Разве основная правда не должна быть «правильными» ответами для набора проверки? Я что-то пропустил в переводе между идентификаторами: s и семантическими метками?
В файле readme из комплекта изображений imagenet 2014 года говорится:
«Всего имеется 50 000 проверочных изображений. Они названы
ILSVRC2012_val_00000001.JPEG
ILSVRC2012_val_00000002.JPEG
...
ILSVRC2012_val_00049999.JPEG
ILSVRC2012_val_00050000.JPEG
Для каждого набора имеется 50 проверочных изображений.
Классификация обоснованности достоверности изображений в
Данные / ILSVRC2014_clsloc_validation_ground_truth.txt,
где каждая строка содержит один ILSVRC2014_ID для одного изображения, в
возрастающий алфавитный порядок имен файлов изображений.
Истина для локализации для валидационных изображений может быть загружена
в формате XML. «
Я делаю это как часть моей дипломной работы бакалавра и действительно хочу сделать это правильно.
Заранее спасибо