Я пытаюсь выполнить некоторую кластеризацию k-средних на очень большой матрице.
Матрица составляет приблизительно 500000 строк x 4000 столбцов, но очень разреженная (только пара значений "1" на строку).
Все это не умещается в памяти, поэтому я преобразовал его в разреженный файл ARFF.Но R, очевидно, не может прочитать разреженный формат файла ARFF.У меня также есть данные в виде простого файла CSV.
Есть ли в R пакет для эффективной загрузки таких разреженных матриц?Затем я бы использовал обычный алгоритм k-средних из пакета кластера.
Большое спасибо