Это расширение существующего вопроса: Преобразование таблицы в матрицу по именам столбцов
Я использую окончательный ответ: https://stackoverflow.com/a/2133898/1287275
Исходный CSVМатрица файла имеет около 1,5 млн строк с тремя столбцами ... индекс строки, индекс столбца и значение.Все числа являются длинными целыми числами.Базовая матрица представляет собой разреженную матрицу размером около 220K x 220K со средним значением около 7 значений в строке.
Оригинальная таблица read.table работает просто отлично.
x <- read.table("/users/wallace/Hadoop_Local/reference/DiscoveryData6Mo.csv", header=TRUE);
Моя проблема возникает, когда я выполняю команду изменения формы.
reshape(x, idvar="page_id", timevar="reco", direction="wide")
Процессор достигает 100%, и он остается навсегда.Машина (Mac) имеет больше памяти, чем R использует.Я не понимаю, почему на создание разреженной матрицы уходит так много времени.
Я использую пакет матрицы по умолчанию.Я не установил ничего лишнего.Я только что скачал R несколько дней назад, поэтому у меня должна быть последняя версия.
Предложения?
Спасибо, Уоллес