Пакет arules в R использует класс «транзакции».Поэтому, чтобы использовать функцию apriori()
, мне нужно преобразовать мои существующие данные.Я получил матрицу с 2 столбцами и примерно 1,6 мм строк и попытался преобразовать данные следующим образом:
transaction_data <- as(split(original_data[,"id"], original_data[,"type"]), "transactions")
, где original_data - это моя матрица данных.Из-за объема данных я использовал самую большую машину AWS Amazon с 64 ГБ ОЗУ.Через некоторое время я получаю
, результирующий вектор превышает предельную длину вектора в 'AnswerType'
Использование памяти машиной все еще было "всего лишь" при 60%.Это ограничение на основе R?Есть ли способ обойти это, кроме использования выборки?При использовании только 1/4 данных преобразование работало нормально.
Редактировать: Как указывалось, одна из переменных была фактором вместо символа.После изменения трансформация была обработана быстро и правильно.