Как получить доверительный интервал данных, основанных на времени высокого стандартного отклонения? - PullRequest
1 голос
/ 14 февраля 2020

Я работаю с анализом некоторых задержек (в секундах). Моя идея состоит в том, чтобы найти доверительный интервал, в котором соответствуют 95% моих результатов, поэтому я могу иметь некоторое представление о PDF.

На первый взгляд, более частые задержки, которые я получаю, составляют менее 30 секунд, но в конечном итоге некоторые проблемы в системе, которые могут дать мне до 25 минут. Меня это не касается, поскольку частота, с которой работает система, составляет около 1 часа за цикл.

Моя точка зрения такова, что при работе со временами, имеющими такую ​​большую разницу, мой доверительный интервал кажется «несправедливым». Вот пример доверительного интервала, который я получил, используя стандартное отклонение:

confidence interval using standard deviation (from scipy stats)

Моя идея состоит в том, чтобы найти наиболее подходящий PDF, получить его параметры и затем используйте это одно, чтобы найти мой доверительный интервал. Я протестировал несколько разных дистрибутивов и получил JohnsonSU, который лучше всего подходит для этих данных. Вот оно:

Best Fit PDF to my data

Могу ли я использовать только параметры JohnsonSU, не используя мои данные, чтобы я мог найти приемлемую достоверность интервал

1 Ответ

0 голосов
/ 14 февраля 2020

Вы можете получить и доверительный интервал по выражению:

(среднее значение (стандартное значение (sq) (n)), среднее значение + (стандартное значение / значение (n))). Если у вас стандартный дистрибутив, и вы знаете стандартную численность населения.

. В противном случае вам нужно проверить специальное c выражение, которое подходит вашему дистрибутиву.

...