Средняя ошибка квантования и топография c ошибка в самоорганизующихся картах - PullRequest
0 голосов
/ 13 марта 2020

Учитывая набор данных из m выборок с n объектами каждая, средняя ошибка квантования самоорганизующейся карты определяется как:

mqe = 1/m * sum( s(x_i,w_b) ),

, где сумма идет от * От 1006 * до i=m и b - это значение k с наиболее похожим вектором веса w_k на случайно выбранный вектор выборки x_r.

Итак, по сути, это сложение евклидовых расстояний между каждой выборкой и ее наилучшей единицей согласования и нормализация результата по общему количеству выборок.

У меня проблема в том, что mqe может быть больше 1. Следовательно, у меня нет интуитивного ощущения, является ли ошибка большой или маленькой. s(x_i,w_b) описывает евклидово расстояние между образцом x_i и вектором веса его bmu, w_b. Это сумма квадратов разностей между записями x_i и w_b. Конечно, результат может быть больше 1. Интересно: как я могу преобразовать мой результат в процент? Я должен был бы разделить результат на наибольшую разницу, то есть наибольшее значение для s(x_i,w_b), которое имеет место для любого образца. Это правильно?

В этом контексте у меня также есть вопрос об ошибке topographi c. Согласно моей книге, оно определяется как:

TE = 1/m * sum(g_i), где сумма увеличивается от i=1 до i= m

и g_i = 1, если w_b и w_{b+1} являются смежными и 0 в противном случае

w_b - это весовой вектор bmu образца, а w_{b+1} - это весовой вектор, который является вторым ближайшим к образцу. Я думаю, что это определение неверно, хотя: g_i должно быть 0, если ближайший и второй весовые векторы выборки смежны, и это должно быть 1 в противном случае. Потому что, когда они смежные, это отражает топографию. Это правильно?

...