Получение 0 для значений t-test и KS test при создании таблицы баланса с ebal - PullRequest
0 голосов
/ 05 мая 2018

Я пытаюсь создать таблицу баланса, используя этот код:

library(ebal)
library(matching)
mout <- MatchBalance(DV ~ someIVs, data=dataset)
balance.test <- baltest.collect(matchbal.out=mout, var.names=colnames(dataset)[-c(unnecessary_variables)], after=FALSE)
balance.test

bal.output <- round(balance.test[,c("mean.Tr","mean.Co","T pval","KS pval")],2)
stargazer(bal.output,title = "Balance Test on Olken Data", type = "text")

Теперь я использовал этот код для других данных, и он работал нормально. На этот раз, однако, я получаю значимые значения «mean.Tr» (среднее значение для лечения) и «mean.Co» (среднее значение для контроля), но значения p для t-критерия и KS-критерия указаны как 0 с. Некоторые из p-значений теста KS сообщаются как NA или (как их выводит stargazer) как пустые ячейки.

Таблица вывода выглядит примерно так:

Balance Test

         mean.Tr   mean.Co   T pval KS pval

IV1      25.820     34.850       0       0   
IV2      10.350     12.120       0       0   
IV3      0.840      0.250        0           
IV4      0.060      0.030        0.130         
IV5      0.190      0.870        0           
IV6      2,095.570  19,428.750   0       0   
IV7      1,532.060  19,063.340   0       0   
IV8      0.710      0.090        0           
IV8      0.600      0.100        0           

Я знаю, что было бы легче загрузить некоторые образцы данных, но, к сожалению, я не могу воспроизвести этот результат с сфабрикованными данными. Поэтому мой вопрос: что в моих данных (или в моем коде) может вызывать такое поведение?

1 Ответ

0 голосов
/ 06 мая 2018

Итак, после большого количества поисков я обнаружил, что 0 в моем тесте баланса являются просто результатом чрезвычайно низких значений p. Пробелы / NA являются результатом того, что тест KS не работает для фиктивных переменных (я думаю, мне следовало пояснить, что пробелы отображаются только для фиктивных переменных).

К сожалению, я до сих пор не понял, почему тест KS не дает значимых p-значений для двоичных переменных. Бинарные переменные также имеют распределение, не так ли? Почему нельзя проверить критерий KS, если распределение одной двоичной переменной совпадает с распределением другой двоичной переменной?

Даже если я ответил на свой вопрос, я все равно был бы признателен за ответ на этот вопрос.

...