математическое распределение вероятностей - PullRequest
1 голос
/ 06 ноября 2010

Это может быть глупый вопрос! У меня есть массив P, который представляет распределение вероятности некоторых данных, например, [0; 0,3; 0,7] Как определить тип или класс дискретного распределения вероятности P? Исходные данные для меня недоступны.

dfittool или fitdist требует, чтобы я предоставил данные в качестве входных данных, в то время как у меня уже есть распределение вероятностей. Есть идеи?

Ответы [ 2 ]

1 голос
/ 06 ноября 2010

Возможно, вы видели разные распределения вероятностей во время лекции или чтения. Все, что вам нужно сделать, это составить график данного распределения против кандидатов. Поскольку сами распределения являются параметризованными, в игру вступает подгонка кривой или пробная ошибка конца. Дистрибутив с наименьшей ошибкой, лучше всего подходит, может быть тот, который вы ищете.

0 голосов
/ 06 ноября 2010

Невозможно выяснить a priori , из какого источника распространяются некоторые данные (особенно с таким низким n, как в вашем примере).

Если у вас есть идеяпроцесса, который генерировал ваши данные, вы можете получить представление о том, какие дистрибутивы тестировать.Возможно, ваши данные поступают из семейства гамма-распределений, может быть, ваши данные поступают из семейства распределений Вейбулла и т. Д. Затем вы можете подогнать эти общие распределения и посмотреть, могут ли они упроститься до более распространенного распределения.* Для визуального представления того, насколько хорошо ваши данные могут приближаться к определенному распределению, вы можете использовать PROBPLOT .

Как только вы определили возможные распределения, вы можете сопоставить их с данными и использовать Байесовский информационный критерий (BIC) , чтобы сравнить, какое из них лучше всего описывает данные.Обратите внимание, что, если у вас нет огромного количества данных, не содержащих шумов, невозможно определить, какая подгонка верна, если у вас есть несколько возможных распределений со сравнительно низким BIC.

...