Ваши данные подвержены выбросам?Это может означать, что другие точки данных, которые составляют 20%, являются выбросами и являются результатом ошибочных измерений или чего-то подобного ... или, по крайней мере, эти данные сильно удалены от других 80% ...
Возьмите кластер, который содержит 80%, и остальные, которые составляют оставшиеся 20%, и изучите их данные отдельно.