Разумно ли рассчитывать вероятность единственного значения, возникающего из пользовательского распределения, как это? - PullRequest
0 голосов
/ 07 октября 2019

Я сгенерировал несколько нулевых распределений, которые варьируются и обычно не соответствуют ни одному из известных распределений, но всегда находятся в диапазоне от 0 до 1. Сейчас я пытаюсь получить вероятность того, что данное значение X исходит из этих распределений.

Я использовал этот поток в качестве отправной точки: https://stats.stackexchange.com/questions/78711/how-to-find-estimate-probability-density-function-from-density-function-in-r

Я хотел бы получить вероятность того, что X исходит из дистрибутива, и я думаю сделать это таким образом - я бы хотелзнать, имеет ли это смысл.

Если X ниже медианы, я интегрирую область от 0 до X и вычисляю 'p-значение' как эту площадь из общей площади при распределении от 0 до 1. Если X выше медианы,Я интегрирую область от X до 1 и беру 'p-значение' в качестве этой области из общей площади.

Ниже я приведу составленный пример с искаженным распределением, где X - 0,8.

sam<-c(0.63461538,0,0,0.07692308,0.03846154,0,0.13461538,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.05769231,0.11538462)
df<-approxfun(density(sam,from=0,to=1))
plot(density(sam,from=0,to=1))
x<-0.8
points(x,df(x),col=2)

# X is larger than median, so I calculate area from X to the end (1)

a<-integrate(df,x,1)
b<-integrate(df,0,1)
a$value/b$value

Это разумный подход? Большое спасибо за любой совет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...