Невозможно выяснить a priori , из какого источника распространяются некоторые данные (особенно с таким низким n, как в вашем примере).
Если у вас есть идеяпроцесса, который генерировал ваши данные, вы можете получить представление о том, какие дистрибутивы тестировать.Возможно, ваши данные поступают из семейства гамма-распределений, может быть, ваши данные поступают из семейства распределений Вейбулла и т. Д. Затем вы можете подогнать эти общие распределения и посмотреть, могут ли они упроститься до более распространенного распределения.* Для визуального представления того, насколько хорошо ваши данные могут приближаться к определенному распределению, вы можете использовать PROBPLOT .
Как только вы определили возможные распределения, вы можете сопоставить их с данными и использовать Байесовский информационный критерий (BIC) , чтобы сравнить, какое из них лучше всего описывает данные.Обратите внимание, что, если у вас нет огромного количества данных, не содержащих шумов, невозможно определить, какая подгонка верна, если у вас есть несколько возможных распределений со сравнительно низким BIC.