Применение лм с map2 - PullRequest
       65

Применение лм с map2

0 голосов
/ 21 января 2019

Я пытаюсь изучить функции карты purrr, используя map2 для применения lm.Используя подмножество набора данных mtcars, я создаю фрейм данных с комбинациями имен переменных, например:

# Load libraries
library(dplyr)
library(purrr)

# Subset data
df <- mtcars %>% select(mpg:qsec) 

# Get variable names
car_vars <- colnames(df)

# Create data frame of variable names
foo <- combn(car_vars, 2) %>% t %>% data.frame

# > head(foo)
#    X1   X2
# 1 mpg  cyl
# 2 mpg disp
# 3 mpg   hp
# 4 mpg drat
# 5 mpg   wt
# 6 mpg qsec

Далее, у меня есть функция, которая принимает имя двух переменных иподходит для линейной модели:

# Fit model
fit_lm <- function(c1, c2){
  lm(paste(c1, c2, sep = "~"), data = df)
} 

Я могу применить это к map2 примерно так:

# Fit all the models 
map2(foo$X1, foo$X2, fit_lm)

, давая список lm объектов, которые при печати выглядят примерно так:

# [[1]]
# 
# Call:
#   lm(formula = paste(c1, c2, sep = "~"), data = df)
# 
# Coefficients:
#   (Intercept)          cyl  
# 37.885       -2.876  

Отлично!Теперь вот где я спотыкаюсь.Я хотел бы добавить эти lm объекты в виде столбца в моем фрейме данных, чтобы у меня были имена переменных в той же строке, что и сама модель.Итак, я использую dplyr mutate с map2.

# Not so successful
foo %>% mutate(mods = map2(X1, X2, fit_lm))

Полученный столбец mods имеет класс NULL, а не lm и выглядит как dputlm объект, в отличие от моей предыдущей (успешной) попытки.Понятно, что я неправильно понял, как работает map2.Может кто-нибудь объяснить мою ошибку?

1 Ответ

0 голосов
/ 21 января 2019

С точки зрения самого результата, то, что вы сделали, прекрасно:

foo <- foo %>% mutate(mods = map2(X1, X2, fit_lm))
str(foo, max.level = 1)
# 'data.frame': 21 obs. of  3 variables:
#  $ X1  : Factor w/ 6 levels "cyl","disp","drat",..: 5 5 5 5 5 5 1 1 1 1 ...
#  $ X2  : Factor w/ 6 levels "cyl","disp","drat",..: 1 2 4 3 6 5 2 4 3 6 ...
#  $ mods:List of 21

Проблема в том, что

class(foo)
# [1] "data.frame"

и такие сложные списки, как у lm классапечально печатаются с print.data.frame.Таким образом, чтобы вместо этого хорошо видеть результат с print.tbl, нам нужно только преобразовать foo в tibble:

foo <- as.tbl(foo)
foo
# A tibble: 21 x 3
#    X1    X2    mods    
#    <fct> <fct> <list>  
#  1 mpg   cyl   <S3: lm>
#  2 mpg   disp  <S3: lm>
#  3 mpg   hp    <S3: lm>
#  4 mpg   drat  <S3: lm>
#  5 mpg   wt    <S3: lm>
#  6 mpg   qsec  <S3: lm>
#  7 cyl   disp  <S3: lm>
#  8 cyl   hp    <S3: lm>
#  9 cyl   drat  <S3: lm>
# 10 cyl   wt    <S3: lm>
# … with 11 more rows
...