Как подобрать наилучшую модель распределения вероятностей к моим данным в python? - PullRequest
0 голосов
/ 16 июня 2019

у меня около 20000 строк данных, таких как:

Id | value
1    30
2    3
3    22
..
n    27

Я сделал статистику по моим данным, среднее значение 33,85, медиана 30,99, минимум 2,8, максимум 206, 95% доверительный интервал 0,21. Так что большинство значений около 33, и есть некоторые выбросы (немного) .. Так похоже на распределение с длинным хвостом.

Я новичок как в дистрибутиве, так и в python, я попробовал class fitter https://pypi.org/project/fitter/, чтобы попробовать много дистрибутивов из пакета Scipy, и дистрибутив loglaplace показал наименьшую ошибку (хотя и не очень-то это понимаю).

Я прочитал почти все вопросы в этой теме и пришел к выводу, что два подхода (1) подгоняют модель распределения, а затем в моем моделировании я рисую случайные значения (2) вычисляю частоту различных групп значений, но это решение не будет например, значение больше 206.

Имея мои данные, которые представляют собой значения (число), каков наилучший подход для подгонки распределения к моим данным в python, так как в моем моделировании мне нужно рисовать числа. Случайные числа должны иметь ту же схему, что и мои данные. Также мне нужно проверить, что модель хорошо представляет мои данные, рисуя мои данные и кривую модели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...