Создание коробочных графиков разрыва между двумя группами по децилям - PullRequest
0 голосов
/ 26 февраля 2019

Я работаю со Stata, и у меня есть оценки по математике для двух разных групп: A и B.

Я хочу увидеть разрыв, который существует между обеими группами в каждом дециле.Кроме того, я хочу сделать рамочный график этого разрыва для каждого дециля (я хочу, чтобы 10 коробочных графиков, по одному для каждого дециля, который показывает разрыв между групповыми оценками).

То, что я сначала сделал, былочтобы вычислить децили, используя xtile для обеих групп:

xtile decileA= mat if group==1, nq(10)

xtile decileB= mat if group==0, nq(10)

Однако группы A и B не имеют одинакового количества наблюдений и одинакового распределения.Я думал о том, чтобы вычислить квантили для каждого дециля и группы и вычесть их, чтобы получить разницу в каждом дециле в каждом квартиле, чтобы создать коробку.Но я не знаю, как после этого приступить к созданию графика, и, учитывая, что у меня разное количество наблюдений в каждой группе децилей, я не знаю, правильно ли продолжать этот путь.

Если я попытаюсьчтобы использовать команду pctile и вычислять разницу в каждом дециле, я теряю все различия в данных внутри каждого дециля.Я получаю только срединные различия, а не все квантили, которые мне нужны.

Пример:

pctile decileA= mat if group==1, nq(10)

pctile decileB= mat if group==0, nq(10)

gen qdiff= decileA- decileB if _n<10

gen qtau=_n/10 if _n<10 

graph box qdiff, over(tau)

Я хочу знать, есть ли способ сделать график, который я собираюсь сделать?

Кросс-пост Статистик .

1 Ответ

0 голосов
/ 26 февраля 2019

Конечно, есть способ выполнить то, что вы хотите, с небольшим усилием, но если цель состоит в том, чтобы сравнить две группы в каждом дециле с некоторым понятием изменчивости, вы можете легко получить это из одновременного квантилярегрессия и производимые им SE:

sysuse auto, clear

sqreg price i.foreign, quantile(.1 .2 .3 .4 .5 .6 .7 .8 .9)

margins, dydx(foreign) ///
predict(outcome(q10))  ///
predict(outcome(q20))  ///
predict(outcome(q30))  ///
predict(outcome(q40))  ///
predict(outcome(q50))  ///
predict(outcome(q60))  ///
predict(outcome(q70))  ///
predict(outcome(q80))  ///
predict(outcome(q90))  ///
post

marginsplot, yline(0) xlab(, grid) ylab(#10, grid angle(90))

Это дает график, показывающий, что иностранное происхождение связано с большей ценой при более высоких децилях, за исключением верхнего дециля, хотя, вероятно, ни одно из различий не являетсяздесь важно, учитывая, что CI перекрываются:

enter image description here

Вы можете даже провести формальные проверки гипотез о том, что эффекты равны следующим образом:

. test _b[1.foreign:9._predict] =  _b[1.foreign:8._predict]

 ( 1)  - [1.foreign]8._predict + [1.foreign]9._predict = 0

           chi2(  1) =    3.72
         Prob > chi2 =    0.0537

С 74 автомобилями мы не можем отрицать, что влияние на 80-й и 90-й процентиль одинаково, хотя точечные оценки имеют противоположные знаки, но схожую величину.

...