У меня есть некоторые отфильтрованные (с dplyr) данные, представленные ниже, из намного большего файла .csv. Я намерен использовать это в качестве моей независимости. переменная в модели линейной регрессии, также я хочу объединить эти столбцы и записать их в .csv (как я делюсь этим с моей командой.)
Я ранее сохранял эти данные в виде «списков» (из-за разница в длине каждой переменной) однако, когда я пишу в CSV, я должен преобразовать его в матрицу и данные очень не так, как ожидалось.
Проблема здесь в том, что каждый отфильтрованный набор имеет разную длину, и поэтому разные значения (CountPD) относятся к разным датам. Как я могу правильно объединить все эти данные в кадр данных (или что-то подобное), где я могу записать как CSV, а также применить линейную регрессию в будущем (ie, где имена столбцов являются «Дата», «y1», "y2" ... et c)
Y1:
structure(list(Date = structure(c(12083, 12111, 12142, 12172,
12203, 17500, 17531, 17562, 17590, 17621, 17651), class = "Date"),
CountPD = c(1, 1, 1, NA, 1, NA, 0.083, NA, NA, 0.083, 0.083
)), row.names = c(1L, 2L, 3L, 4L, 5L, 179L, 180L, 181L, 182L,
183L, 184L), class = "data.frame")
Y2:
structure(list(Date = structure(c(17013, 17044, 17074, 17105,
17135, NA), class = "Date"), CountPD = c(NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_)), row.names = c("1",
"2", "3", "4", "5", "NA"), class = "data.frame")
Y3:
structure(list(Date = structure(c(12783, 12814, 12842, 12873,
12903, 17500, 17531, 17562, 17590, 17621, 17651), class = "Date"),
CountPD = c(NA, 0.333, NA, NA, NA, NA, 0.125, 0.125, 0.222,
0.2, 0.25)), row.names = c(1L, 2L, 3L, 4L, 5L, 156L, 157L,
158L, 159L, 160L, 161L), class = "data.frame")
Y4:
structure(list(Date = structure(c(12356, 12417, 12448, 12477,
12508, 17500, 17531, 17562, 17590, 17621, 17651), class = "Date"),
CountPD = c(NA, NA, NA, NA, NA, 0.2, 0.2, 0.182, 0.182, 0.222,
0.25)), row.names = c(1L, 2L, 3L, 4L, 5L, 160L, 161L, 162L,
163L, 164L, 165L), class = "data.frame")```