Учитывая набор данных из m выборок с n объектами каждая, средняя ошибка квантования самоорганизующейся карты определяется как:
mqe = 1/m * sum( s(x_i,w_b) )
,
, где сумма идет от * От 1006 * до i=m
и b
- это значение k
с наиболее похожим вектором веса w_k
на случайно выбранный вектор выборки x_r
.
Итак, по сути, это сложение евклидовых расстояний между каждой выборкой и ее наилучшей единицей согласования и нормализация результата по общему количеству выборок.
У меня проблема в том, что mqe может быть больше 1. Следовательно, у меня нет интуитивного ощущения, является ли ошибка большой или маленькой. s(x_i,w_b)
описывает евклидово расстояние между образцом x_i
и вектором веса его bmu, w_b
. Это сумма квадратов разностей между записями x_i
и w_b
. Конечно, результат может быть больше 1. Интересно: как я могу преобразовать мой результат в процент? Я должен был бы разделить результат на наибольшую разницу, то есть наибольшее значение для s(x_i,w_b)
, которое имеет место для любого образца. Это правильно?
В этом контексте у меня также есть вопрос об ошибке topographi c. Согласно моей книге, оно определяется как:
TE = 1/m * sum(g_i)
, где сумма увеличивается от i=1
до i= m
и g_i = 1
, если w_b
и w_{b+1}
являются смежными и 0 в противном случае
w_b
- это весовой вектор bmu образца, а w_{b+1}
- это весовой вектор, который является вторым ближайшим к образцу. Я думаю, что это определение неверно, хотя: g_i
должно быть 0, если ближайший и второй весовые векторы выборки смежны, и это должно быть 1 в противном случае. Потому что, когда они смежные, это отражает топографию. Это правильно?