Функция кластера в R, которая принимает длинные векторы? - PullRequest
0 голосов
/ 11 июля 2019

У меня есть около 700 000 наблюдений, которые можно упорядочить и объединить для целей социальных наук.Кто-нибудь пытался сгруппировать много категориальных наблюдений в R?

Я изначально использовал оптимальное соответствие и пакеты TraMineR и WeightedCluster (потрясающие пакеты), когда у меня было меньше наблюдений.Это не работает для моих новых данных.Даже при сжатии неуникальных последовательностей у меня все еще есть около 70000 строк с 8 столбцами для кластеризации.(Каждый ряд - это человек).Мне удалось создать матрицу различий с помощью функции gower.dist ().

Обычно я получаю сообщение об ошибке, например "длинные векторы не разрешены", когда я пытаюсь выполнить кластеризацию с такими функциями, как diana () в пакете кластера иhclust () в пакете статистики.

Я знаю, что многие функции в R могут использовать базовый код .C и .Fortran, который не принимает целые числа, превышающие определенную длину, и не поддерживает длинные векторы.

Кто-нибудь пробовал кластеризациюс методом, который принимает длинные векторы?Я чувствую, что кластеризация 70000 записей с 8 столбцами невелика, но я сталкиваюсь с проблемами.

...