Я пытаюсь выполнить ks.test для вложенного фрейма данных, где $ data.x (вектор, содержащий данные подмножества) и $ data.y (вектор, содержащий полные данные) являются списками.Используя dplyr у меня есть
ksResults <- dataframe %>% group_by(groupName, .id) %>%
do(test_result = ks.test(x = .$data.x, y = .$data.y))
, но это возвращает следующую ошибку Error in ks.test(x = .$data.x, y = .$data.y) :
'y' must be numeric or a function or a string naming a valid function
Я не уверен, как заставить это работать.Разве я делаю unnest перед выполнением ks.test?
Это большой фрейм данных, но заголовок dput (2) равен
`structure(list(groupName = c("127 Creek",
"127 Creek"), .id = 1:2, data.x = list(structure(list(
answer = c(2, 0, 0)), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -3L)), structure(list(answer = c(-1, 2,
2)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA,
-3L))), data.y = list(structure(list(answer = structure(c(2L,
3L, 2L, 2L, 4L, 1L, 5L, 2L, 3L, 3L, 1L, 4L, 4L, 4L, 1L, 3L, 3L,
4L, 2L, 3L, 2L, 3L, 2L, 3L, 4L, 2L, 4L, 1L, 3L, 3L, 3L, 2L, 4L,
4L, 2L, 3L, 4L, 1L, 1L, 1L, 5L, 3L, 6L, 2L, 2L, 2L, 2L, 3L, 4L,
4L, 3L, 3L, 3L, 4L, 4L, 1L, 1L, 4L, 5L, 5L, 3L, 4L, 3L, 2L, 5L,
2L, 4L, 4L, 4L, 4L, 2L, 5L, 5L, 2L, 2L, 3L, 1L, 3L, 3L, 3L, 5L,
4L, 2L, 3L, 2L, 3L, 2L, 2L, 2L, 5L, 6L, 2L, 2L, 3L, 1L, 2L, 2L,
5L, 3L, 6L, 2L, 3L, 2L, 3L, 2L, 2L, 5L, 3L, 3L, 2L, 2L, 4L, 4L,
5L, 5L, 3L, 2L, 3L, 1L, 4L, 4L, 4L, 2L, 5L, 4L, 3L, 3L, 7L, 7L,
4L, 2L, 4L, 2L, 2L, 3L, 2L, 6L, 2L, 5L, 3L, 5L, 3L, 3L, 3L, 2L,
4L, 2L, 5L, 3L, 6L, 3L, 2L, 4L, 2L, 2L, 3L, 4L, 5L, 6L, 3L, 5L,
3L, 3L, 2L, 2L, 3L, 2L, 4L, 2L, 3L, 1L, 1L, 2L, 1L, 6L, 3L, 2L,
3L, 3L, 2L, 2L, 3L, 5L, 6L, 5L, 4L, 6L, 5L, 4L, 4L, 4L, 6L, 4L,
3L, 3L, 2L, 1L, 2L, 5L, 5L, 5L, 4L, 5L, 2L, 2L, 3L, 4L, 5L, 2L,
5L, 7L, 4L, 4L, 5L, 6L, 4L, 2L, 5L, 4L, 4L, 3L, 1L, 2L, 3L, 4L,
3L, 4L, 4L, 2L, 4L, 3L, 2L, 3L, 3L, 3L, 6L, 4L, 3L, 4L, 4L, 5L,
4L, 2L, 3L, 5L, 3L, 4L, 3L, 5L, 2L, 6L, 5L, 3L, 5L, 7L, 4L, 2L,
3L, 5L, 2L, 4L, 4L, 5L), .Label = c("3", "2", "1", "0", "-1",
"-2", "-3"), class = "factor")), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -263L)), structure(list(answer = structure(c(2L,
3L, 2L, 2L, 4L, 1L, 5L, 2L, 3L, 3L, 1L, 4L, 4L, 4L, 1L, 3L, 3L,
4L, 2L, 3L, 2L, 3L, 2L, 3L, 4L, 2L, 4L, 1L, 3L, 3L, 3L, 2L, 4L,
4L, 2L, 3L, 4L, 1L, 1L, 1L, 5L, 3L, 6L, 2L, 2L, 2L, 2L, 3L, 4L,
4L, 3L, 3L, 3L, 4L, 4L, 1L, 1L, 4L, 5L, 5L, 3L, 4L, 3L, 2L, 5L,
2L, 4L, 4L, 4L, 4L, 2L, 5L, 5L, 2L, 2L, 3L, 1L, 3L, 3L, 3L, 5L,
4L, 2L, 3L, 2L, 3L, 2L, 2L, 2L, 5L, 6L, 2L, 2L, 3L, 1L, 2L, 2L,
5L, 3L, 6L, 2L, 3L, 2L, 3L, 2L, 2L, 5L, 3L, 3L, 2L, 2L, 4L, 4L,
5L, 5L, 3L, 2L, 3L, 1L, 4L, 4L, 4L, 2L, 5L, 4L, 3L, 3L, 7L, 7L,
4L, 2L, 4L, 2L, 2L, 3L, 2L, 6L, 2L, 5L, 3L, 5L, 3L, 3L, 3L, 2L,
4L, 2L, 5L, 3L, 6L, 3L, 2L, 4L, 2L, 2L, 3L, 4L, 5L, 6L, 3L, 5L,
3L, 3L, 2L, 2L, 3L, 2L, 4L, 2L, 3L, 1L, 1L, 2L, 1L, 6L, 3L, 2L,
3L, 3L, 2L, 2L, 3L, 5L, 6L, 5L, 4L, 6L, 5L, 4L, 4L, 4L, 6L, 4L,
3L, 3L, 2L, 1L, 2L, 5L, 5L, 5L, 4L, 5L, 2L, 2L, 3L, 4L, 5L, 2L,
5L, 7L, 4L, 4L, 5L, 6L, 4L, 2L, 5L, 4L, 4L, 3L, 1L, 2L, 3L, 4L,
3L, 4L, 4L, 2L, 4L, 3L, 2L, 3L, 3L, 3L, 6L, 4L, 3L, 4L, 4L, 5L,
4L, 2L, 3L, 5L, 3L, 4L, 3L, 5L, 2L, 6L, 5L, 3L, 5L, 7L, 4L, 2L,
3L, 5L, 2L, 4L, 4L, 5L), .Label = c("3", "2", "1", "0", "-1",
"-2", "-3"), class = "factor")), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -263L)))), row.names = c(NA, -2L), class = c("tbl_df",
"tbl", "data.frame"))`