тест MATLAB для нормального распределения (не тест для ненормального распределения) - PullRequest
2 голосов
/ 16 февраля 2012

У меня есть набор из 100000 номеров.Подбирая гауссиан к моим данным, я могу визуально увидеть, что точки почти точно следуют гауссову.Используя normplot, я вижу, что мои данные снова следуют гауссову, за исключением небольшого шума на хвостах.

Теперь, что я ищу, так это функцию, которая может дать мне значение p, которое отвергает нулевую гипотезучто мои данные не являются нормальными.Lilleforfs и Jbtest имеют нулевую гипотезу, что данные являются нормальными.Я могу отклонить нулевые надежды, если подберу данные примерно до 100 баллов.

Что я действительно хочу, так это отказаться от гипотезы о том, что мои данные обычно не распространяются, с некоторым связанным p-значением.Возможно ли это?

редактировать: мои данные представляют собой целые числа в диапазоне от 1 до 100.

Вероятно, следовало бы сохранить свои записи от статистики за 3 года.

Ответы [ 2 ]

4 голосов
/ 16 февраля 2012

Это невозможно в том виде, в котором вы спрашиваете: существует причина, по которой тесты на нормальность не имеют нулевой гипотезы, заключающейся в том, что данные не обычно не распространяются.

СпособТрадиционные тесты гипотез часто встречаются при использовании нулевой гипотезы для характеристики нулевого распределения вашей тестовой статистики.В этот момент необычные значения вашей тестовой статистики (то есть те, которые необычно высоки или низки в пределах вашего нулевого распределения) сигнализируют о том, что что-то не так - маловероятно, что вы получите такое значение, если нулевая гипотеза верна.В тесте, где нулевая гипотеза состоит в том, что данные нормальные, это легко.Мы много знаем о нормальном распределении, поэтому мы можем описать, как будет выглядеть нулевое распределение тестовой статистики.

Но теперь рассмотрим воображаемый тест, в котором нулевая гипотеза состоит в том, что данные не нормально распределен.В соответствии с этой нулевой гипотезой, как выглядит наша тестовая статистика (что бы мы ни выбрали)?Мы не знаем, потому что это может быть почти любой дистрибутив! Это может быть гамма, бета, логарифмическая, экспоненциальная, Коши или та, о которой мы никогда не слышали.Существует буквально бесконечное число возможных распределений, которым он может следовать, поэтому сказать, «как бы эти данные выглядели согласно этой гипотезе», не работает.

ETA: Если ваши данные целые, невозможно, чтобы они были нормально распределены, так как нормальное распределение непрерывно.Возможно, они биномиальные ?

0 голосов
/ 09 сентября 2014

Вы можете посмотреть на ktest, однократный тест Колмогорова-Смирнова. В основном он проверяет, нормально ли распределен ваш набор данных с некоторым значением значимости.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...