Предположим, что мы имеем дело с независимыми и одинаково распределенными случайными величинами X 1 , ..., X n .Тогда E [X i ] = mu и Var [X i ] = сигма 2 для каждого i = 1, ..., n.Таким образом, в вашем примере 4.037 будет выборочной оценкой mu, а 1.727 будет выборочной оценкой сигмы.
А как насчет этого диапазона (mu - сигма, mu + сигма)?Вероятность падения X i составляет F (mu + сигма) - F (mu-сигма), где F - кумулятивная функция распределения X i .В случае нормального распределения это действительно около 0,68.В других случаях это, конечно, не должно быть где-то близко к 0,68.Фактически, неравенство Чебышева едва ли дает F (mu + сигма) - F (mu-сигма)> = 0 (неинформативный результат).Например, в случае Gamma (2,3) вероятность составляет около 0,74, а t-распределение с 3 степенями свободы дает около 0,82.
Теперь кто-то может предложить использовать центральную предельную теорему, чтобы сказать0,68 - это число для любого распределения вероятностей.Это было бы неправильно, однако.Центральная предельная теорема говорит о том, где и как сконцентрировано среднее , а не каждое отдельное наблюдение.
Итак, без дальнейших предположений вы не можете сказать гораздо больше сопределенность . Вот пример, показывающий, что даже 0% данных могут попадать в этот интервал.Если бы были доступны другие статистические данные, можно было бы получить более точные границы.Кроме того, поскольку я понимаю, что это секунды для временных интервалов, вы можете посмотреть на распределения для такого моделирования , как Gamma и Weibull.Если вы хотите предположить, что ваши временные интервалы соответствуют одному из этих распределений, оценка параметров распределения позволит дать оценки относительно диапазона, соответствующего любому проценту, а не только 68%.