Инференциальная статистика работает по сравнению с известными дистрибутивами.В случае регрессии этим распределением обычно является t-распределение
. Вы заметите, что каждая переменная имеет оценочный коэффициент, из которого вычисляется связанная t-статистика.Например, x1
имеет значение t -0.278
.Чтобы получить значение p, мы берем это значение t, помещаем его в распределение t и вычисляем вероятность получения такого же экстремального значения, как и вычисленное вами значение t.Вы можете получить некоторую интуицию для этого, заметив, что столбец p-значения называется P>|t|
Дополнительная сложность заключается в том, что точная форма t-распределения зависит от степеней свободы
Таким образом, для вычисления p-значения вам понадобятся 2 элемента информации: t-статистика и остаточные степени свободы вашей модели (в вашем случае 97)
В качестве примера взят x1
,Вы можете вычислить p-значение в Python следующим образом:
import scipy.stats
scipy.stats.t.sf(abs(-0.278), df=97)*2
0.78160405761659357
То же самое делается для каждого из других предикторов, используя их соответствующие t-значения