У меня возникают некоторые проблемы при попытке кластеризации стран, используя некую культурную корреляцию, которая у меня уже есть.
В основном, набор данных выглядит следующим образом: 90 стран, 91 столбец (90 столбцов стран + один копределить нации в строках) и 90 строк
Nation Ita Fra Ger Esp Eng ...
Ita NA 0.2 0.1 0.6 0.4 ...
Fra 0.2 NA 0.2 0.1 0.3 ...
Ger 0.7 0.1 NA 0.5 0.4
Esp 0.6 0.1 0.5 NA 0.2
Eng 0.4 0.3 0.4 0.2 NA
... .....
...
Я ищу алгоритм, который объединяет мои страны в группы (например, группы из 3 или, что еще лучше, более гибкие кластеры, так что числокластеров и число стран на кластер не фиксировано, например,
, поэтому выходные данные, например,
Nation cluster
Ita 1
Fra 2
Ger 3
Esp 1
Eng 3
......