Question

Как вы извлекаете значение p (для значимости коэффициента единственной объясняющей переменной, отличной от нуля) и значение R-квадрата из простой модели линейной регрессии? Например ...

x = cumsum(c(0, runif(100, -1, +1)))
y = cumsum(c(0, runif(100, -1, +1)))
fit = lm(y ~ x)
summary(fit)

Я знаю, что summary(fit) отображает значение p и значение R в квадрате, но я хочу иметь возможность вставить их в другие переменные.

Vincent · Answer 1 · 08 апреля 2011

Обратите внимание, что summary(fit) генерирует объект со всей необходимой информацией.В нем хранятся векторы бета, se, t и p.Получите p-значения, выбрав 4-й столбец матрицы коэффициентов (хранится в объекте сводки):

summary(fit)$coefficients[,4] 
summary(fit)$r.squared

Попробуйте str(summary(fit)), чтобы увидеть всю информацию, содержащуюся в этом объекте.

Редактировать: я неправильно прочитал ответ Чейза, который в основном говорит вам, как добраться до того, что я здесь даю.

Chase · Answer 2 · 08 апреля 2011

r-квадрат : Вы можете вернуть значение r-квадрат непосредственно из итогового объекта summary(fit)$r.squared. См. names(summary(fit)) для получения списка всех элементов, которые вы можете извлечь напрямую.

Значение p модели: Если вы хотите получить значение p общей модели регрессии, это сообщение в блоге описывает функцию для возврата значения p:

lmp <- function (modelobject) {
    if (class(modelobject) != "lm") stop("Not an object of class 'lm' ")
    f <- summary(modelobject)$fstatistic
    p <- pf(f[1],f[2],f[3],lower.tail=F)
    attributes(p) <- NULL
    return(p)
}

> lmp(fit)
[1] 1.622665e-05

В случае простой регрессии с одним предиктором, значение p модели и значение p для коэффициента будут одинаковыми.

Коэффициенты p-значений: Если у вас есть более одного предиктора, то приведенное выше вернет p-значение модели, и значение p для коэффициентов можно извлечь с помощью:

summary(fit)$coefficients[,4]

В качестве альтернативы, вы можете получить p-значение коэффициентов из объекта anova(fit) аналогично описанному выше объекту сводки.

jberg · Answer 3 · 08 апреля 2011

Вы можете увидеть структуру объекта, возвращенного summary(), вызвав str(summary(fit)). К каждой части можно получить доступ, используя $. Значение p для статистики F легче получить из объекта, возвращаемого anova.

Кратко, вы можете сделать это:

rSquared <- summary(fit)$r.squared
pVal <- anova(fit)$'Pr(>F)'[1]

richiemorrisroe · Answer 4 · 08 апреля 2011

Хотя оба приведенных выше ответа хороши, процедура извлечения частей объектов носит более общий характер.

Во многих случаях функции возвращают списки, а к отдельным компонентам можно получить доступ с помощью str(), чтораспечатайте компоненты вместе с их именами.Затем вы можете получить к ним доступ, используя оператор $, то есть myobject$componentname.

В случае объектов lm есть несколько предопределенных методов, которые можно использовать, например coef(), resid(), summary() и т. Д., Но вам не всегда будет так повезло.

Konrad · Answer 5 · 01 мая 2016

Я перебираю этот вопрос, изучая предложенные решения для аналогичной проблемы;Я полагаю, что для дальнейшего использования может оказаться целесообразным обновить имеющийся список ответов решением, использующим пакет broom.

Пример кода

x = cumsum(c(0, runif(100, -1, +1)))
y = cumsum(c(0, runif(100, -1, +1)))
fit = lm(y ~ x)
require(broom)
glance(fit)

Результаты

>> glance(fit)
  r.squared adj.r.squared    sigma statistic    p.value df    logLik      AIC      BIC deviance df.residual
1 0.5442762     0.5396729 1.502943  118.2368 1.3719e-18  2 -183.4527 372.9055 380.7508 223.6251          99

Примечания

Я считаю полезной функцию glance, поскольку она аккуратно суммирует полезные значения.В качестве дополнительного преимущества результаты сохраняются в виде data.frame, что облегчает дальнейшие манипуляции:

>> class(glance(fit))
[1] "data.frame"

theforestecologist · Answer 6 · 20 февраля 2016

Расширение ответа @Vincent :

Для lm() созданных моделей:

summary(fit)$coefficients[,4]   ##P-values 
summary(fit)$r.squared          ##R squared values

Для gls() созданных моделей:

summary(fit)$tTable[,4]         ##P-values
##R-squared values are not generated b/c gls uses max-likelihood not Sums of Squares

Чтобы изолировать само отдельное p-значение, вы должны добавить номер кода в код:

Например, чтобы получить доступ к p-значению перехвата в обеих сводках модели:

summary(fit)$coefficients[1,4]
summary(fit)$tTable[1,4]

Обратите внимание, что номер столбца можно заменить именем столбца в каждом из приведенных выше случаев:
```
summary(fit)$coefficients[1,"Pr(>|t|)"]  ##lm 
summary(fit)$tTable[1,"p-value"]         ##gls 
```

Если вывсе еще не знаете, как получить доступ к значению из сводной таблицы, используйте str(), чтобы выяснить структуру сводной таблицы:

str(summary(fit))

RTrain3k · Answer 7 · 16 сентября 2016

Это самый простой способ получить значения p:

coef(summary(modelname))[, "Pr(>|t|)"]

Dorian Grv · Answer 8 · 02 июня 2013

Я использовал эту функцию lmp довольно много раз.

И в один прекрасный момент я решил добавить новые функции для улучшения анализа данных. Я не эксперт в R или статистике, но люди обычно смотрят на различную информацию о линейной регрессии:

р-величина
а и б
r²
и, конечно, аспект распределения точек

Давайте рассмотрим пример. Вы здесь

Вот воспроизводимый пример с разными переменными:

Ex<-structure(list(X1 = c(-36.8598, -37.1726, -36.4343, -36.8644, 
-37.0599, -34.8818, -31.9907, -37.8304, -34.3367, -31.2984, -33.5731
), X2 = c(64.26, 63.085, 66.36, 61.08, 61.57, 65.04, 72.69, 63.83, 
67.555, 76.06, 68.61), Y1 = c(493.81544, 493.81544, 494.54173, 
494.61364, 494.61381, 494.38717, 494.64122, 493.73265, 494.04246, 
494.92989, 494.98384), Y2 = c(489.704166, 489.704166, 490.710962, 
490.653212, 490.710612, 489.822928, 488.160904, 489.747776, 490.600579, 
488.946738, 490.398958), Y3 = c(-19L, -19L, -19L, -23L, -30L, 
-43L, -43L, -2L, -58L, -47L, -61L)), .Names = c("X1", "X2", "Y1", 
"Y2", "Y3"), row.names = c(NA, 11L), class = "data.frame")


library(reshape2)
library(ggplot2)
Ex2<-melt(Ex,id=c("X1","X2"))
colnames(Ex2)[3:4]<-c("Y","Yvalue")
Ex3<-melt(Ex2,id=c("Y","Yvalue"))
colnames(Ex3)[3:4]<-c("X","Xvalue")

ggplot(Ex3,aes(Xvalue,Yvalue))+
          geom_smooth(method="lm",alpha=0.2,size=1,color="grey")+
          geom_point(size=2)+
          facet_grid(Y~X,scales='free')


#Use the lmp function

lmp <- function (modelobject) {
  if (class(modelobject) != "lm") stop("Not an object of class 'lm' ")
  f <- summary(modelobject)$fstatistic
    p <- pf(f[1],f[2],f[3],lower.tail=F)
    attributes(p) <- NULL
    return(p)
    }

# create function to extract different informations from lm

lmtable<-function (var1,var2,data,signi=NULL){
  #var1= y data : colnames of data as.character, so "Y1" or c("Y1","Y2") for example
  #var2= x data : colnames of data as.character, so "X1" or c("X1","X2") for example
  #data= data in dataframe, variables in columns
  # if signi TRUE, round p-value with 2 digits and add *** if <0.001, ** if < 0.01, * if < 0.05.

  if (class(data) != "data.frame") stop("Not an object of class 'data.frame' ")
  Tabtemp<-data.frame(matrix(NA,ncol=6,nrow=length(var1)*length(var2)))
  for (i in 1:length(var2))
       {
  Tabtemp[((length(var1)*i)-(length(var1)-1)):(length(var1)*i),1]<-var1
  Tabtemp[((length(var1)*i)-(length(var1)-1)):(length(var1)*i),2]<-var2[i]
  colnames(Tabtemp)<-c("Var.y","Var.x","p-value","a","b","r^2")

  for (n in 1:length(var1))
  {
  Tabtemp[(((length(var1)*i)-(length(var1)-1))+n-1),3]<-lmp(lm(data[,var1[n]]~data[,var2[i]],data))

  Tabtemp[(((length(var1)*i)-(length(var1)-1))+n-1),4]<-coef(lm(data[,var1[n]]~data[,var2[i]],data))[1]

  Tabtemp[(((length(var1)*i)-(length(var1)-1))+n-1),5]<-coef(lm(data[,var1[n]]~data[,var2[i]],data))[2]

  Tabtemp[(((length(var1)*i)-(length(var1)-1))+n-1),6]<-summary(lm(data[,var1[n]]~data[,var2[i]],data))$r.squared
  }
  }

  signi2<-data.frame(matrix(NA,ncol=3,nrow=nrow(Tabtemp)))
  signi2[,1]<-ifelse(Tabtemp[,3]<0.001,paste0("***"),ifelse(Tabtemp[,3]<0.01,paste0("**"),ifelse(Tabtemp[,3]<0.05,paste0("*"),paste0(""))))
  signi2[,2]<-round(Tabtemp[,3],2)
  signi2[,3]<-paste0(format(signi2[,2],digits=2),signi2[,1])

  for (l in 1:nrow(Tabtemp))
    {
  Tabtemp$"p-value"[l]<-ifelse(is.null(signi),
         Tabtemp$"p-value"[l],
         ifelse(isTRUE(signi),
                paste0(signi2[,3][l]),
                Tabtemp$"p-value"[l]))
  }

   Tabtemp
}

# ------- EXAMPLES ------

lmtable("Y1","X1",Ex)
lmtable(c("Y1","Y2","Y3"),c("X1","X2"),Ex)
lmtable(c("Y1","Y2","Y3"),c("X1","X2"),Ex,signi=TRUE)

Конечно, есть более быстрое решение, чем эта функция, но оно работает.

Saftever · Answer 9 · 18 февраля 2019

Для окончательного значения p, отображаемого в конце summary(), функция использует pf() для расчета из значений summary(fit)$fstatistic.

fstat <- summary(fit)$fstatistic
pf(fstat[1], fstat[2], fstat[3], lower.tail=FALSE)

Источник: [1], [2]

Jojo · Answer 10 · 26 марта 2016

x = cumsum(c(0, runif(100, -1, +1)))
y = cumsum(c(0, runif(100, -1, +1)))
fit = lm(y ~ x)
> names(summary(fit))
[1] "call"          "terms"        
 [3] "residuals"     "coefficients" 
 [5] "aliased"       "sigma"        
 [7] "df"            "r.squared"    
 [9] "adj.r.squared" "fstatistic"   
[11] "cov.unscaled" 
    summary(fit)$r.squared

вытащить р-значения и г-квадрат из линейной регрессии

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пример кода

Результаты

Примечания

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

вытащить р-значения и г-квадрат из линейной регрессии

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пример кода

Результаты

Примечания

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов