Делать ks.test на вложенном фрейме данных - PullRequest
0 голосов
/ 25 сентября 2019

Я пытаюсь выполнить ks.test для вложенного фрейма данных, где $ data.x (вектор, содержащий данные подмножества) и $ data.y (вектор, содержащий полные данные) являются списками.Используя dplyr у меня есть

ksResults <- dataframe %>% group_by(groupName, .id) %>% 
             do(test_result = ks.test(x = .$data.x, y = .$data.y))

, но это возвращает следующую ошибку Error in ks.test(x = .$data.x, y = .$data.y) : 'y' must be numeric or a function or a string naming a valid function

Я не уверен, как заставить это работать.Разве я делаю unnest перед выполнением ks.test?

Это большой фрейм данных, но заголовок dput (2) равен

`structure(list(groupName = c("127 Creek", 
"127 Creek"), .id = 1:2, data.x = list(structure(list(
    answer = c(2, 0, 0)), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -3L)), structure(list(answer = c(-1, 2, 
2)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
-3L))), data.y = list(structure(list(answer = structure(c(2L, 
3L, 2L, 2L, 4L, 1L, 5L, 2L, 3L, 3L, 1L, 4L, 4L, 4L, 1L, 3L, 3L, 
4L, 2L, 3L, 2L, 3L, 2L, 3L, 4L, 2L, 4L, 1L, 3L, 3L, 3L, 2L, 4L, 
4L, 2L, 3L, 4L, 1L, 1L, 1L, 5L, 3L, 6L, 2L, 2L, 2L, 2L, 3L, 4L, 
4L, 3L, 3L, 3L, 4L, 4L, 1L, 1L, 4L, 5L, 5L, 3L, 4L, 3L, 2L, 5L, 
2L, 4L, 4L, 4L, 4L, 2L, 5L, 5L, 2L, 2L, 3L, 1L, 3L, 3L, 3L, 5L, 
4L, 2L, 3L, 2L, 3L, 2L, 2L, 2L, 5L, 6L, 2L, 2L, 3L, 1L, 2L, 2L, 
5L, 3L, 6L, 2L, 3L, 2L, 3L, 2L, 2L, 5L, 3L, 3L, 2L, 2L, 4L, 4L, 
5L, 5L, 3L, 2L, 3L, 1L, 4L, 4L, 4L, 2L, 5L, 4L, 3L, 3L, 7L, 7L, 
4L, 2L, 4L, 2L, 2L, 3L, 2L, 6L, 2L, 5L, 3L, 5L, 3L, 3L, 3L, 2L, 
4L, 2L, 5L, 3L, 6L, 3L, 2L, 4L, 2L, 2L, 3L, 4L, 5L, 6L, 3L, 5L, 
3L, 3L, 2L, 2L, 3L, 2L, 4L, 2L, 3L, 1L, 1L, 2L, 1L, 6L, 3L, 2L, 
3L, 3L, 2L, 2L, 3L, 5L, 6L, 5L, 4L, 6L, 5L, 4L, 4L, 4L, 6L, 4L, 
3L, 3L, 2L, 1L, 2L, 5L, 5L, 5L, 4L, 5L, 2L, 2L, 3L, 4L, 5L, 2L, 
5L, 7L, 4L, 4L, 5L, 6L, 4L, 2L, 5L, 4L, 4L, 3L, 1L, 2L, 3L, 4L, 
3L, 4L, 4L, 2L, 4L, 3L, 2L, 3L, 3L, 3L, 6L, 4L, 3L, 4L, 4L, 5L, 
4L, 2L, 3L, 5L, 3L, 4L, 3L, 5L, 2L, 6L, 5L, 3L, 5L, 7L, 4L, 2L, 
3L, 5L, 2L, 4L, 4L, 5L), .Label = c("3", "2", "1", "0", "-1", 
"-2", "-3"), class = "factor")), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -263L)), structure(list(answer = structure(c(2L, 
3L, 2L, 2L, 4L, 1L, 5L, 2L, 3L, 3L, 1L, 4L, 4L, 4L, 1L, 3L, 3L, 
4L, 2L, 3L, 2L, 3L, 2L, 3L, 4L, 2L, 4L, 1L, 3L, 3L, 3L, 2L, 4L, 
4L, 2L, 3L, 4L, 1L, 1L, 1L, 5L, 3L, 6L, 2L, 2L, 2L, 2L, 3L, 4L, 
4L, 3L, 3L, 3L, 4L, 4L, 1L, 1L, 4L, 5L, 5L, 3L, 4L, 3L, 2L, 5L, 
2L, 4L, 4L, 4L, 4L, 2L, 5L, 5L, 2L, 2L, 3L, 1L, 3L, 3L, 3L, 5L, 
4L, 2L, 3L, 2L, 3L, 2L, 2L, 2L, 5L, 6L, 2L, 2L, 3L, 1L, 2L, 2L, 
5L, 3L, 6L, 2L, 3L, 2L, 3L, 2L, 2L, 5L, 3L, 3L, 2L, 2L, 4L, 4L, 
5L, 5L, 3L, 2L, 3L, 1L, 4L, 4L, 4L, 2L, 5L, 4L, 3L, 3L, 7L, 7L, 
4L, 2L, 4L, 2L, 2L, 3L, 2L, 6L, 2L, 5L, 3L, 5L, 3L, 3L, 3L, 2L, 
4L, 2L, 5L, 3L, 6L, 3L, 2L, 4L, 2L, 2L, 3L, 4L, 5L, 6L, 3L, 5L, 
3L, 3L, 2L, 2L, 3L, 2L, 4L, 2L, 3L, 1L, 1L, 2L, 1L, 6L, 3L, 2L, 
3L, 3L, 2L, 2L, 3L, 5L, 6L, 5L, 4L, 6L, 5L, 4L, 4L, 4L, 6L, 4L, 
3L, 3L, 2L, 1L, 2L, 5L, 5L, 5L, 4L, 5L, 2L, 2L, 3L, 4L, 5L, 2L, 
5L, 7L, 4L, 4L, 5L, 6L, 4L, 2L, 5L, 4L, 4L, 3L, 1L, 2L, 3L, 4L, 
3L, 4L, 4L, 2L, 4L, 3L, 2L, 3L, 3L, 3L, 6L, 4L, 3L, 4L, 4L, 5L, 
4L, 2L, 3L, 5L, 3L, 4L, 3L, 5L, 2L, 6L, 5L, 3L, 5L, 7L, 4L, 2L, 
3L, 5L, 2L, 4L, 4L, 5L), .Label = c("3", "2", "1", "0", "-1", 
"-2", "-3"), class = "factor")), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -263L)))), row.names = c(NA, -2L), class = c("tbl_df", 
"tbl", "data.frame"))`
...