Как кластеризовать данные с помощью самоорганизующихся карт? - PullRequest
0 голосов
/ 02 сентября 2018

Предположим, что мы обучаем самоорганизующуюся карту (SOM) с данным набором данных. Имеет ли смысл кластеризовать нейроны СДЛ вместо исходных точек данных? Это сомнение пришло ко мне после прочтения этой статьи , в которой говорится следующее:

Самое важное преимущество этой процедуры является то, что вычислительная нагрузка значительно уменьшается, что делает можно кластеризовать большие наборы данных и рассмотреть несколько различные стратегии предварительной обработки за ограниченное время. Естественно, подход действителен, только если кластеры найдены с использованием SOM аналогичны исходным данным.

В этом ответе четко указано, что SOM не включают кластеризацию, но некоторая процедура кластеризации на SOM может быть выполнена после того, как она обучена. Я думал, что это означает, что кластеризация была сделана на нейронах СДЛ, которые в некотором смысле являются отображением исходных данных, но я не уверен в этом. Итак, что я хочу знать:

  • Правильно ли кластеризовать данные, выполняя алгоритм кластеризации на весах обученных нейронов в качестве точек данных? Если нет, то как кластеризация выполняется с помощью SOM?
  • Какими характеристиками должен обладать набор данных в целом, чтобы этот подход был полезным?

1 Ответ

0 голосов
/ 03 сентября 2018

Да, обычный подход кажется иерархическим или k-средним (вам нужно разобраться, как это было первоначально сделано - как видно из статьи, которую вы связали, много вариантов, включая два Уровневые подходы были изучены позже) на нейронах. Если вы считаете, что СДЛ являются методом квантования и проецирования, все эти подходы применимы.

Это дешевле, потому что они просто двухмерные, евклидовы, и гораздо меньше точек. Так что это хорошо соответствует источнику, который у вас есть.

Обратите внимание, что нейрон SOM может быть пустым, если он находится между двумя чрезвычайно хорошо разделенными кластерами.

...