В какой последовательности проводится кластерный анализ? - PullRequest
0 голосов
/ 27 ноября 2010

Сначала найдите минимальные частые шаблоны из базы данных.
Затем разделите их на различные типы данных, такие как интервальные, двоичные, порядковые переменные и т. Д., И определите различные меры расстояния для всех переменных.
Наконец, примените метод кластерного анализа.

Правильна ли эта последовательность или я что-то упустил?

1 Ответ

0 голосов
/ 13 сентября 2011

правы вы или нет, зависит от того, что вы хотите сделать.Общий подход, который вы описываете, кажется, идет в правильном направлении, но вы никогда не узнаете, достигли ли вы цели, пока не ответите на следующие вопросы:

  1. Каковы ваши данные?
  2. Что вы пытаетесь найти / Какой кластерный метод вы хотите использовать?

Из того, что вы описываете, мне кажется, что вы хотите выполнить "предварительную обработку" шагов, таких как выбор объектов и векторизация.К сожалению, это само по себе может быть довольно сложным.Например, одной из самых больших частичных проблем является разработка функции расстояния (доступно огромное количество исследований).

Итак, пожалуйста, дайте нам больше информации о вашем конкретном целевом приложении.

...