У меня есть набор данных с n = 100 000 наблюдений с p = 2 миллионами переменных.Я не могу загрузить все данные сразу в память, и ковариационная матрица тоже не поместится (2 миллиона x 2 миллиона).Есть ли способ в R получить большинство релевантных основных компонентов (я думаю, ~ 5000–10 000, объясняя 99% общего отклонения)?
Я пытаюсь выяснить, есть ли хорошая реализация итеративнойалгоритм.Пакеты, которые я нашел, кажутся либо прекращенными, либо для приближения нескольких первых основных компонентов.
Если нет пакета с предварительно скомпилированными алгоритмами, какой итерационный алгоритм вы бы предложили получить на большинстве ПК?(что я могу сам кодировать)