несколько графиков из фреймов данных в списке после условного теста - PullRequest
1 голос
/ 06 июля 2011

У меня сложная проблема с применением функции к списку фреймов данных.В конечном итоге я хочу построить отдельные временные ряды для большого набора данных о потреблении наркотиков.

В моем наборе данных содержится 30 различных антибиотиков, уровень потребления которых собирался ежемесячно в течение 5 лет.Имеет 3 столбца и 1692 строки.

Пока что я составил список отдельных фреймов данных для каждого класса антибиотиков.(Название списка - drug, drug.class - это символьный вектор названий лекарств из исходного фрейма данных)

drugList <- list()
n<-length(drug.class)
for (i in 1:n){
  drugList[[i]] <-AB[Drug==(drug.class[i]),]
}

Например, у меня есть 30 фреймов данных в списке со следующими столбцами:

[[29]]
           Drug  Usage      DateA
1353 Tobramycin  5.06 01-Jan-2006
1354 Tobramycin  4.21 01-Feb-2006
1355 Tobramycin  6.34 01-Mar-2006
.
.
. 
          Drug  Usage       DateA
678 Vancomycin  11.62 01-Jan-2006
679 Vancomycin  11.94 01-Feb-2006
680 Vancomycin  14.29 01-Mar-2006

Перед выполнением каждого графика выполняется логический тест, чтобы определить, является ли временной ряд автокоррелированным.Данные в списке имеют очень большую длину.Я написал функцию для выполнения теста следующим образом:

acTest <- function(){
    id<-ts(1:length(DateA))
    a1<-ts(Usage)
    a2<-lag(a1-1)
    tg<-ts.union(a1,id,a2)
    mg<-lm(a1~a2+bs(id,df=3), data=tg)
    a2Pval <- summary(mg)$coefficients[2, 4]
    if (a2Pval<=0.05) {
        TRUE
    } else {
        FALSE
    }
}

Я ранее проверил все свои функции на отдельных фреймах данных, и они работают как положено.

Я пытаюсь выработатькак применить тест к каждому фрейму данных в списке лекарств.Я верю, что если мне удастся получить помощь в решении этой проблемы, я смогу применить функции временных рядов таким же образом.

Заранее благодарен за любую предложенную помощь.

1 Ответ

1 голос
/ 06 июля 2011

Несколько предложений:

Измените функцию acTest, чтобы она фактически принимала data.frame в качестве параметра.В противном случае у вас будет много проблем с функцией, которая ищет (и изменяет) объекты с именами DateA и Usage в глобальной среде.

acTest <- function(dat){
    id<-ts(1:length(dat$DateA))
    a1<-ts(dat$Usage)
    a2<-lag(a1-1)
    tg<-ts.union(a1,id,a2)
    mg<-lm(a1~a2+bs(id,df=3), data=tg)
    a2Pval <- summary(mg)$coefficients[2, 4]
    if (a2Pval<=0.05) {
        TRUE
    } else {
        FALSE
    }
}

Применение функции к каждому элементу списка является обычной задачей вR. Это (чаще всего) выполняется с использованием lapply.

lapply(drugList,FUN=acTest)

Наконец, вы можете выполнять такие задачи, не сохраняя каждый фрейм данных как отдельный элемент списка, используя такие инструменты, как ddply (средидругие), которые разделяют фрейм данных с помощью одной переменной, применяют функцию к каждому фрагменту и затем снова собирают их в один фрейм данных.В вашем случае это будет выглядеть примерно так:

ddply(AB,.(Drug),.fun = acTest)
...