Как ввести данные для теста Шапиро Уилка с помощью Python Scipy - PullRequest
0 голосов
/ 12 октября 2018

Я пытаюсь выполнить тест нормальности с моими данными.

# Method 1
import numpy as np
from scipy.stats import shapiro

data = [1874181.6503, 2428393.05517, 2486600.8183,...] # there are 146 data points
data = np.array(data)
stat, p = shapiro(data)
print('statistics=%.3f, p=%.3f' % (stat, p))
alpha = 0.05
if p > alpha:
    print('its Gaussian ')
else:
    print('not Gaussian')

---- Вывод ----

statistics=0.582, p=0.000 
not Gaussian

Когда я его запускаю, яполучить его не по гауссову, и когда я вычисляю среднее и стандартное отклонение и генерирую выборку, используя np.random.normal (mu, sigma, 149) (образец показан ниже), тогда он отображается как гауссовский

# Method 2 
import numpy as np
from scipy.stats import shapiro

data = [1874181.6503, 2428393.05517, 2486600.8183,...] # there are 146 data points

data = np.array(data)
d_mu = np.mean(data)
d_sig = np.std(data)
data = np.random.normal(d_mu,d_sig, 146)
stat, p = shapiro(data)
print('statistics=%.3f, p=%.3f' % (stat, p))

alpha = 0.05
if p > alpha:
    print('its Gaussian ')
else:
    print('not Gaussian')

----- Вывод ----

statistics=0.987, p=0.212
its Gaussian 

Я очень новичок в аналитике данных, будет полезно, если кто-то может помочь мне в следующих сомнениях

  1. Какой метод для теста Шапиро является правильным?Метод 1 или Метод 2 ..?
  2. Мне трудно понять функцию np.random.normal (d_mu, d_sig, 146).Определение, данное в документах: «Вычеркнуть случайные выборки из нормального (гауссовского) распределения».Но какую выборку данных она генерирует, у нас уже есть данные (мои входные данные), и мы рассчитали среднее значение и стандартное отклонение для построения графика нормального распределения, и функция возвращает некоторую другую выборку данных, и мой тест Шапиро для этого работает (я знаю, что полностью ошибаюсь, но не могу решить, какой из них правильный)

  3. Я пытаюсь сделать нормальное распределение для данных временных рядов.Любые полезные ссылки на документы, которые можно предложить ...?сделать тест на нормальность и нормальное распределение.Все, что ведет меня в правильном направлении

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...