lapply возвращает список замыканий вместо списка data.frames - PullRequest
2 голосов
/ 27 апреля 2019

Мне нужно применить пользовательскую функцию к нескольким TXT-файлам, вывод которых выглядит следующим образом при применении к отдельному TXT-файлу:

abs_fun("50609.txt")
TIME      SECCODE    min(abs)
1  100000000 SU24018RMFS2 0.001374406
2  100000000 SU25081RMFS9 0.005432396
3  100000000 SU25082RMFS7 0.008767195
4  100000000 SU26203RMFS8 0.003786367
5  100000000 SU26205RMFS3 0.015636145
6  100000000 SU26206RMFS1 0.002658508
7  100000000 SU26207RMFS9 0.005674432
8  100000000 SU26208RMFS7 0.007532075
9  100000000 SU26212RMFS9 0.005923634
10 100000000 SU26215RMFS2 0.019073299
11 100000000 SU29006RMFS2 0.002031761
12 100000000 SU46020RMFS2 0.025543226

Когда я использую lapplyследующим образом:

filelist <- list.files(pattern = "*.txt")
datalist2 <- lapply(filelist, function(x)abs_fun)

Вместо data.frames я получаю список замыканий (так выглядит моя пользовательская функция):

[[1]]
function (x) 
{
    data <- read.table(x, header = T, sep = ",")
    buy <- subset(data, select = c("PRICE", "TIME", "ACTION", 
        "BUYSELL", "SECCODE", "VOLUME")) %>% filter(ACTION == 
        1, BUYSELL == "B")
    buy$ACTION = NULL
    buy$BUYSELL = NULL
    sell <- subset(data, select = c("PRICE", "TIME", "ACTION", 
        "BUYSELL", "SECCODE", "VOLUME")) %>% filter(ACTION == 
        1, BUYSELL == "S")
    sell$ACTION = NULL
    sell$BUYSELL = NULL
    buysell <- inner_join(x = buy, y = sell, by = c("SECCODE", 
        "TIME"), all = TRUE)
    buysell$diff <- buysell$PRICE.y - buysell$PRICE.x
    head(buysell, n = 100)
    buysell <- group_by_at(buysell, vars(TIME, SECCODE))
    summarise(buysell, min(diff))
    buysell$abs <- (buysell$PRICE.y - buysell$PRICE.x)/(buysell$PRICE.y + 
        buysell$PRICE.x)/2
    abs <- as.data.frame(summarise(buysell, min(abs)))
    return(abs)
}

[[2]]
...

Как получить списокВместо этого data.frames (как в примере с "50609.txt") или извлекать выходные данные функции из замыканий?

1 Ответ

3 голосов
/ 27 апреля 2019

Проблема в том, что функция не применяется к элементам list.Здесь у нас есть анонимная функция (function(x) x)

lapply(filelist, function(x)abs_fun(x))

, или она может применяться напрямую без анонимного вызова

lapply(filelist, abs_fun)

Проблема ОП может быть воспроизведена с помощью

lapply(mtcars, function(x) mean)

вместо этого должно быть

lapply(mtcars, function(x) mean(x))
...