добрый вечер,
Я новичок в кодировании CNN У меня есть набор данных подсчета толпы ShanghaiTech, в котором есть (помимо изображений) файлы .mat, что, как я считаю, является основной истиной для (подсчета) изображений.
Я пытаюсь напечатать содержимое одного файла .mat в python, вот что я получаю:
{'image_info': array([[array([[(array([[ 855.32345978, 590.49587357],
[ 965.5908524 , 472.79472415],
[ 937.09478464, 400.93507502],
...,
[ 42.5852337 , 359.87860699],
[1017.48233659, 8.99748811],
[1017.48233659, 23.31916643]]), array([[920]], dtype=uint16))]],
dtype=[('location', 'O'), ('number', 'O')])]], dtype=object), '__version__': '1.0', '__header__': 'MATLAB 5.0 MAT-file, Platform: PCWIN64, Created on: Fri Nov 18 20:06:05 2016', '__globals__': []}
каждый файл .mat соответствует одному изображению, я знаю, в какой-то моментв CNN нам нужно вычислить ошибку между результатом сети и имеющейся у нас правдой, но я, кажется, не понимаю структуру и содержание этих файлов .mat.
Может кто-нибудь объяснить, что в этихфайлы и как или для чего этот контент используется в оценке толпы.