Я должен выполнить кластеризацию k-средних на действительно огромной матрице (около 300.000x100.000 значений, что превышает 100 Гб). Я хочу знать, могу ли я использовать программное обеспечение R для выполнения этого или weka.
Мой компьютер является мультипроцессором с 8 ГБ оперативной памяти и сотнями ГБ свободного места.
У меня достаточно места для вычислений, но загрузка такой матрицы, по-видимому, является проблемой для R (я не думаю, что использование пакета bigmemory помогло бы мне, и большая матрица автоматически использует всю мою оперативную память, а затем файл подкачки, если этого недостаточно. пространство).
Итак, мой вопрос: какое программное обеспечение мне следует использовать (в конечном счете, в сочетании с некоторыми другими пакетами или пользовательскими настройками).
Спасибо за помощь.
Примечание: я использую Linux.