Question

У меня есть набор данных с n = 100 000 наблюдений с p = 2 миллионами переменных.Я не могу загрузить все данные сразу в память, и ковариационная матрица тоже не поместится (2 миллиона x 2 миллиона).Есть ли способ в R получить большинство релевантных основных компонентов (я думаю, ~ 5000–10 000, объясняя 99% общего отклонения)?

Я пытаюсь выяснить, есть ли хорошая реализация итеративнойалгоритм.Пакеты, которые я нашел, кажутся либо прекращенными, либо для приближения нескольких первых основных компонентов.

Если нет пакета с предварительно скомпилированными алгоритмами, какой итерационный алгоритм вы бы предложили получить на большинстве ПК?(что я могу сам кодировать)

PCA в больших (p >> n) больших наборах данных в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

PCA в больших (p >> n) больших наборах данных в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы