Странная подгонка истории использует scipy gamma и weibull_min - PullRequest
0 голосов
/ 27 декабря 2018

Я проверил EES, я чувствую, что это должно быть правильно, но результат такой странный.Я надеюсь, что кто-то может помочь мне.Я довольно новичок в Python и статистики.Я не знаю, если это нормально, но те же данные, которые я использую Matlab, результат выглядит вполне нормально.

# -*- coding: utf-8 -*-
import matplotlib.pyplot as plt
import scipy.stats as st
import seaborn as sns
import numpy as np

data = [ 40, 21, 14, 9, 14, 32, 28, 42, 33, 30, 40, 14, 11, 32,
  53, 163,  28,  13,  14,  15,  16,  15,  12,   9,  12,  21,  41,  24,
  12,  26,  14,  36,  22,   4,  36,  13,  71,  10,  30,  17,  89,  31,
  30,  13,  37,  22,  30,  32,  31,  20,  19,  53,  18,  30,  31,  11,
  39,  37,  12,  26,   9,   9,]

sns.set()
DISTRIBUTIONS = [st.norm,st.gamma,st.weibull_min,st.burr,st.beta]
bins_=20

def cal_sse(fitting,data,bins):
    y, x = np.histogram(data , bins=bins)
    bin_width = x[1]-x[0]
    x_mid = (x + np.roll(x, -1))[:-1] / 2.0
    N = len(data)
    params = fitting.fit(data)
    arg = params[:-2]
    loc = params[-2]
    scale = params[-1]
    pdf = fitting.pdf(x_mid, loc=loc, scale=scale, *arg)
    pdf_scaled = pdf * bin_width * N
    sse = np.sum((y - pdf_scaled)**2)
    if fitting == st.weibull_min:
        print(y,x)
        print('------------------')
        print(pdf_scaled )
    return sse

def draw_fitting(data,bins,fittings):
    for fit in range(len(fittings)):
        if fit == 0:
            sns.distplot(data,bins=bins, kde=False, fit=fittings[fit],fit_kws={"color": "g", "linewidth": 3,"dashes":[6, 2]})
            print(cal_sse(fittings[fit],data,bins))
        else:
            sns.distplot(data,bins=bins, kde=False ,fit=fittings[fit],hist_kws={"alpha":0})
            print(cal_sse(fittings[fit],data,bins))

draw_fitting(data,bins_,DISTRIBUTIONS)
plt.show()

результат

...