Расчет уровней достоверности распределения - PullRequest
0 голосов
/ 22 мая 2018

У меня есть набор данных, который выглядит следующим образом:

data = [1,1,2,3,3,5,5]
point = 6

Я не знаю, являются ли эти данные нормальными или что-то еще о их распределении.Я хотел бы с некоторой уверенностью рассчитать, что point значительно выше, чем data.

, который я пробовал:

import math
from scipy.stats import t
import numpy as np
confidence = (
    t.interval(0.95,len(data)-1,loc=np.mean(data),
    scale=np.std(data)/math.sqrt(len(data))))

Это возвращает нижнюю и верхнюю границу, но частопри обработке моих фактических данных, point, который я использую, кажется значительно повышенным, но намного ниже многих чисел, содержащихся в data.Использую ли я лучший тест или есть что-то лучшее?

1 Ответ

0 голосов
/ 22 мая 2018

Формулы для доверительных интервалов можно найти в википедии.Предполагая, что вы знаете формулу, и предполагая, что данные нормальные, вы можете сделать что-то вроде ...

import numpy as np

data = np.array([1,1,2,3,3,5,5])
z_alpha = 1.96 #Change for appropriate alpha level.  I use standard normal, but you could use t-dist
n = data.size
m = data.mean()
s = data.std()
interval = m + z_alpha*s/np.sqrt(n)*np.array([-1,1])

# Point in interval?

point = 6

(point<=interval[1])&(point>=interval[0]) 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...