Чтобы закрыть этот вопрос, я должен упомянуть, что ответ @ Axeman - это единственный подход, подходящий для моей проблемы. Весь вопрос в том, что для управления такой огромной проектной матрицей недостаточно памяти.
Поэтому запустите пробитную регрессию с использованием пакета biglm
, а функция bigglm()
- единственное решение, которое я нашел до сих пор.
Тем не менее, я понимаю, что из-за того, как пакет biglm
работает, принимая итеративные фрагменты данных, использование factor()
переменных в RHS проблематично c каждый раз, когда уровень фактора не представлены в куске. Другими словами, если факторная переменная имеет 5 уровней, но в блоке данных отображаются только 4 уровня, у меня будет ошибка в оценке.
Есть несколько вопросов и комментариев по этому поводу Stackoverflow .