CLARA описана в Kaufman and Rousseeuw (1990).
Характеристики этого алгоритма состоят в том, что он может работать со значительно большим набором данных из-за его линейной сложности как в памяти, так и в вычислительных требованиях.
Gower расстояние вычисляет матрицу различий, сложность памяти которой экспоненциально O (n ^ 2), что означает, что вы получите матрицу 11,4 миллиона строк и 11,4 миллиона столбцов.Понятно, что это невозможно.
Если вы хотите использовать расстояние gower, вы должны попытаться работать с меньшими подвыборками и использовать подход кластеризации снизу вверх.