Как разбить большой набор данных на несколько матриц? - PullRequest
0 голосов
/ 04 августа 2020

В настоящее время я работаю над проектом по биржевым данным в R. Я только новичок, и последние 6 месяцев мне было чрезвычайно трудно учиться у моего наставника из-за Covid и блокировки. Мне дали набор данных по акциям PERMCO, 14 столбцов и около 4 миллионов записей. Меня попросили сделать с данными следующее:

  • получить случайные фрагменты из 20/21, возвращаемых

  • построить матрицу, строку будет иметь 20/21 последовательности

  • 22 наблюдения = 2 последовательности

  • Извлеките все эти последовательности возвращений и поместите их в строку, каждая матрица с длиной строки 21.

  • Сложите гигантскую матрицу из всех этих мини-матриц, она будет иметь 21 столбец и миллион строк.

  • Затем я передаю это в нейронную сеть (на следующем шаге мне пока не нужно этого делать).

- все эти данные о запасах являются месячными.

Это буквально единственная информация, которую мне дали, и я отчаянно нуждаюсь в помощи, я даже не знаю, с чего начать. Мои знания R очень базовые c. Я искал учебные пособия в Интернете, и ничего не соответствовало приведенным выше инструкциям. Любая помощь будет принята с благодарностью

...