У меня есть матрица расстояний / различий (30K строк, 30K столбцов), которая рассчитывается в цикле и сохраняется в ПЗУ.
Я бы хотела провести кластеризацию по матрице.Я импортирую и кластеризую его, как показано ниже:
Mydata<-read.csv("Mydata.csv")
Mydata<-as.dist(Mydata)
Results<-hclust(Mydata)
Но когда я конвертирую матрицу в dist
объект, я получаю ошибку ограничения ОЗУ.Как я могу справиться с этим?Можно ли запустить алгоритм hclust
в цикле / чанкинге?Я имею в виду, что я делю матрицу расстояний на куски и запускаю их в цикле?