объяснить землю-правда .mat файл изображения для CNN - PullRequest
0 голосов
/ 25 июня 2018

добрый вечер,

Я новичок в кодировании CNN У меня есть набор данных подсчета толпы ShanghaiTech, в котором есть (помимо изображений) файлы .mat, что, как я считаю, является основной истиной для (подсчета) изображений.

Я пытаюсь напечатать содержимое одного файла .mat в python, вот что я получаю:

{'image_info': array([[array([[(array([[ 855.32345978,  590.49587357],
   [ 965.5908524 ,  472.79472415],
   [ 937.09478464,  400.93507502],
   ...,
   [  42.5852337 ,  359.87860699],
   [1017.48233659,    8.99748811],
   [1017.48233659,   23.31916643]]), array([[920]], dtype=uint16))]],
  dtype=[('location', 'O'), ('number', 'O')])]], dtype=object), '__version__': '1.0', '__header__': 'MATLAB 5.0 MAT-file, Platform: PCWIN64, Created on: Fri Nov 18 20:06:05 2016', '__globals__': []}

каждый файл .mat соответствует одному изображению, я знаю, в какой-то моментв CNN нам нужно вычислить ошибку между результатом сети и имеющейся у нас правдой, но я, кажется, не понимаю структуру и содержание этих файлов .mat.

Может кто-нибудь объяснить, что в этихфайлы и как или для чего этот контент используется в оценке толпы.

1 Ответ

0 голосов
/ 25 июля 2018

поэтому я получил ответ, данные в .mat, представленные в вопросе, содержат (или, по крайней мере, то, что нас интересует) два массива, первый:

array([[ 855.32345978,  590.49587357],
   [ 965.5908524 ,  472.79472415],
   [ 937.09478464,  400.93507502],
   ...,
   [  42.5852337 ,  359.87860699],
   [1017.48233659,    8.99748811],
   [1017.48233659,   23.31916643]])

- это N массивом 2 , 2 соответствует целевому объекту X и Y , а также N - количество целевых объектов ( истина земли )

; второй массив содержит истину земли

данные из файла .mat были извлечены с помощью scipy.io.loadmat, а структура данных - словарь, в настоящее время это довольно сложно, но это выглядит так:

matContent=spy.io.loadmat(os.path.join(gtPath,gtList[1])) #var type is dictionary
gt=matContent['image_info'][0][0][0][0][1] #getting the ground-thruth number
...