Я нашел шаблон кластеризации ниже в иерархической кластеризации, используя минимальную дисперсию Уорда в R. Я эмпирически определил пять чисел кластеров, основываясь на том, имеют ли характеристики отдельных людей смысл. Даже если я использую высоту (обозначенную линией «Вырезать» на диаграмме), я все равно получаю те же 4 кластера, однако 5-й (синий) кластер сокращается еще в двух кластерах.
Вопрос: Мой вопрос заключается в том, обязательно ли разрезать 5-й кластер на заданную c высоту, даже если это не имеет смысла согласно знаниям, основанным на исследованиях? Или я могу эмпирически решить сохранить 5 кластеров? вносит ли это какое-либо смещение в анализ?