Как я могу доказать, что данные эксперимента соответствуют распределению тяжелых хвостов? - PullRequest
0 голосов
/ 05 марта 2012

У меня есть несколько результатов теста задержки ответа сервера. Согласно нашему теоретическому анализу, распределение задержки должно иметь поведение с тяжелым хвостом. Но как я могу доказать, что результат теста соответствует распределению с тяжелым хвостом?

Ответы [ 2 ]

1 голос
/ 07 сентября 2018

Я думаю, что самый простой способ - наилучшим образом подобрать половину нормального распределения и посмотреть, насколько хорошо он описывает хвост.В Python вы можете сделать это с помощью scipy.stats.halfnorm.fit() или использовать модуль длиннохвостый , который предназначен для построения и анализа тяжелых хвостов (https://github.com/Mottl/longtail):

import numpy as np
import longtail

# generate random values from heavy tailed distribution (let's take Laplace)
X = np.random.laplace(size=10000)
X = X[X>0]  # take only right half of the distribution

# get best fit of half normal distribution to our data:
params = longtail.fit_distributions(X, distributions=['halfnorm'])

# visualize X and best fit:
longtail.plot(X, params=params)

Поскольку точки нахвосты находятся выше половины нормального приближения, данное распределение можно считать имеющим более тяжелый хвост, чем половина нормы:

enter image description here
enter image description here

1 голос
/ 05 марта 2012

Я не эксперт, но я думаю, что оценка эксцесса вашего распределения задержки была бы хорошим началом.

Если вы знаете теоретическое распределение задержки, вы также можете сделать тест на пригодность .

...