Как рассчитать наклон линии регрессии через разные интервалы на кривой и применить к нескольким столбцам - PullRequest
0 голосов
/ 02 октября 2019

Я хочу вычислить наклон линии регрессии через разные интервалы на кривой, а затем применить ее к нескольким столбцам в фрейме данных a, чтобы получить новый фрейм данных Curve_9.20. Ниже приведен сильно подмножественный фрейм данных и код, который я использую для запуска функции Curve, но она выдает отображаемую ошибку.

a <- structure(list(RunTime = c(7.043, 7.093, 7.143, 7.193, 7.243, 
7.293, 7.343, 7.393, 7.443, 7.493, 7.543, 7.593, 7.643, 7.693, 
7.743, 7.793, 7.843, 7.893, 7.943, 7.993, 8.043, 8.093, 8.142, 
8.193, 8.243, 8.293, 8.343, 8.393, 8.443, 8.493, 8.543, 8.593, 
8.643, 8.693, 8.743, 8.793, 8.843, 8.893, 8.943, 8.993, 9.043
), O2_229 = c(216.272, 216.006, 216.164, 215.976, 215.937, 216.012, 
216.224, 216.354, 216.584, 216.477, 216.347, 216.538, 216.315, 
216.385, 216.297, 216.363, 216.353, 216.301, 216.379, 216.594, 
216.192, 215.955, 216.134, 216.155, 216.254, 216.316, 216.313, 
216.413, 216.477, 216.225, 216.347, 216.16, 215.976, 216.093, 
216.224, 216.179, 216.239, 216.349, 216.085, 216.089, 216.213
), O2_35 = c(183.962, 184.032, 184.143, 184.134, 183.979, 184.028, 
184.176, 184.055, 184.119, 184.137, 184.094, 184.114, 184.308, 
184.097, 184.2, 184.287, 184.048, 184.263, 184.263, 184.346, 
184.322, 184.256, 184.462, 184.155, 184.246, 184.328, 184.232, 
184.418, 184.379, 184.331, 184.367, 184.298, 184.351, 184.375, 
184.333, 184.351, 184.33, 184.247, 184.388, 184.404, 184.392)), class = 
"data.frame", row.names = 142:182)

Curve <- function(y)
{
c(coef(lm(y ~ RunTime, subset(a, RunTime >= 7.043 & RunTime <= 
8.043)))[2], # 10%
coef(lm(y ~ RunTime, subset(a, RunTime >= 9.000 & RunTime <= 
9.043)))[2]) # 20%
}

Curve_9.20 <- data.frame("LightIntensity" = c("10%", "20%"), 
lapply(a[c(2,3)], Curve))


Error in model.frame.default(formula = y ~ RunTime, data = 
subset(a,  : variable lengths differ (found for 'RunTime')

1 Ответ

0 голосов
/ 02 октября 2019

Вы предоставляете lm переменную y из исходного набора данных и x из подмножества, таким образом, ошибка разной длины. Вы можете решить эту проблему, указав lm с именами столбцов, так что все переменные будут вызываться из подмножества.
Поскольку правая часть формулы одинакова для обоих случаев, самый простой способ - пропустить всю формулув виде одной строки и в каждой итерации lapply будет меняться только y.

a <- structure(list(RunTime = c(7.043, 7.093, 7.143, 7.193, 7.243, 
                                7.293, 7.343, 7.393, 7.443, 7.493, 7.543, 7.593, 7.643, 7.693, 
                                7.743, 7.793, 7.843, 7.893, 7.943, 7.993, 8.043, 8.093, 8.142, 
                                8.193, 8.243, 8.293, 8.343, 8.393, 8.443, 8.493, 8.543, 8.593, 
                                8.643, 8.693, 8.743, 8.793, 8.843, 8.893, 8.943, 8.993, 9.043
), O2_229 = c(216.272, 216.006, 216.164, 215.976, 215.937, 216.012, 
              216.224, 216.354, 216.584, 216.477, 216.347, 216.538, 216.315, 
              216.385, 216.297, 216.363, 216.353, 216.301, 216.379, 216.594, 
              216.192, 215.955, 216.134, 216.155, 216.254, 216.316, 216.313, 
              216.413, 216.477, 216.225, 216.347, 216.16, 215.976, 216.093, 
              216.224, 216.179, 216.239, 216.349, 216.085, 216.089, 216.213
), O2_35 = c(183.962, 184.032, 184.143, 184.134, 183.979, 184.028, 
             184.176, 184.055, 184.119, 184.137, 184.094, 184.114, 184.308, 
             184.097, 184.2, 184.287, 184.048, 184.263, 184.263, 184.346, 
             184.322, 184.256, 184.462, 184.155, 184.246, 184.328, 184.232, 
             184.418, 184.379, 184.331, 184.367, 184.298, 184.351, 184.375, 
             184.333, 184.351, 184.33, 184.247, 184.388, 184.404, 184.392)), class = 
  "data.frame", row.names = 142:182)


Curve <- function(y)
{
  y <- paste0(y, '~ RunTime')
  c(coef(lm(y, subset(a, RunTime >= 7.043 & RunTime <= 
                                  8.043)))[2], # 10%
    coef(lm(y, subset(a, RunTime >= 9.000 & RunTime <= 
                                  9.043)))[2]) # 20%
}

Curve_9.20 <- data.frame("LightIntensity" = c("10%", "20%"), 
                         lapply(names(a[c(2,3)]), Curve))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...