Как применить t-тест для всей таблицы с NA в R - PullRequest
0 голосов
/ 19 июня 2020

моя таблица выглядит примерно так:

date        factor1      factor2     factor3
1973-01-31  3.112309    1.011383    NA
1973-02-28  2.120466    11.021701    NA
1973-03-31  1.125156    0.030822    1.011383    
1973-04-30  11.135342   1.067682    1.067682    
1973-05-31  NA          -1.069136    1.071959    
1973-06-30  1.139889    1.071959    1.034

Я пытаюсь вычислить t-значение, проверяя гипотезу о том, что среднее значение каждого столбца равно нулю, используя метод NeweyWest.

coeftest(lm(data~1), vcov = NeweyWest(lm(data~1), lag = 6, prewhite = F, adjust = T))

Однако я всегда получаю код ошибки:

Error in dimnames(x) <- dn : 
  length of 'dimnames' [1] not equal to array extent

Я почти уверен, что это связано с NA в моей таблице. Я пробовал использовать na.action функции lm. Однако это не сработало. Я могу рассчитать t-значение для каждого столбца индивидуально, но я ищу решение для вычисления t-значения для всей таблицы сразу, поскольку это огромная таблица. Есть ли у кого-нибудь идея решить мою проблему? Я очень благодарен за каждый намек.

1 Ответ

0 голосов
/ 19 июня 2020

может потребоваться оценить недостающие значения, например https://stats.stackexchange.com/questions/26326/how-to-estimate-missing-data

Или поискать надежные методы, вызываемые таким образом (надежный t-тест).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...