У меня есть продольный набор данных с семью повторениями по времени для каждого субъекта,
Я пытаюсь использовать линейную смешанную модель следующим образом:
сначала я создал сгруппированный набор данных
datos4g.new <-
groupedData( costo_ventasn ~ I(periodo- 2012) | nit,
data = as.data.frame( train4 ),
FUN = mean,
labels = list( x = "periodo",
y = "costo_ventas estandarizado" ),
units = list( x = "(yr)", y = "(COP)") )
periodo находится в train4 $ periodo, и его значения - это годы с 2012 -2017 (double)
Затем я позвонил lme:
datos4g.lme44 <- lme(costo_ventasn~I(periodo-2012)+ balccn + rtrm -1
, random = ~1|nit, data=datos4g.new)
Проблема возникает потому, что результаты резко меняются, если я меняю I (период-2012) на
любое другое значение, подобное I (период-2010):
1) При использовании I (период-2012)
datos4g.lme44 <- lme(costo_ventasn~I(periodo-2012)+ balccn + rtrm -1
, random = ~1|nit, data=datos4g.new)
Value Std.Error DF t-value p-value
I(periodo - 2012) 0.01611919 0.01555038 102 1.0365783 0.3024
balccn -0.04600571 0.03089891 102 -1.4889103 0.1396
rtrm -0.04184548 0.07349777 102 -0.5693436 0.5704
2) Если я изменю вызов lme на
datos4g.lme44 <- lme(costo_ventasn~I(periodo-2010)+ balccn + rtrm -1
, random = ~1|nit, data=datos4g.new)
Результаты будут совершенно другими:
При использовании I (periodo -2010)
Value Std.Error DF t-value p-value
I(periodo - 2010) 0.1133182 0.01265807 102 8.952247 0
balccn -0.2473934 0.02121564 102 -11.660895 0
Rtrm -0.4806404 0.06335742 102 -7.586174 0
¿Я хочу знать, вызвано ли это изменение использованием сгруппированного набора данных, какова правильная модель
?
Заранее спасибо за любую помощь.