Я хочу знать, как scipy.stats
использует свои методы fit
и pdf
. Согласно документации, fit(data, a, loc = 0, scale = 1)
оценивает параметры для data
, а pdf(x, a, loc=0, scale=1) computes probability density function
. Но я не мог найти, как fit
и pdf
фактически выполняются, статистически и математически.
Я использую данные sm.datasets.elnino
, использую код из tmthydvnprt
import warnings
import numpy as np
import pandas as pd
import scipy.stats as st
import statsmodels as sm
import matplotlib
import matplotlib.pyplot as plt
data = pd.Series(sm.datasets.elnino.load_pandas().data.set_index('YEAR').values.ravel())
y, x = np.histogram(data, bins = 50, density = True)
x = (x + np.roll(x, -1))[:-1] / 2.0
distribution = st.gennorm
params = distribution.fit(data)
arg = params[:-2]
loc = params[-2]
scale = params[-1]
pdf = distribution.pdf(x, loc = loc, scale = scale, *arg)
sse = np.sum(np.power(y - pdf, 2.0))
Использование data
, arg
= 4,3836, loc
= 23,2991, scale
= 3,8499.
Я хочу знать, что представляют arg
, loc
и scale
и как они рассчитываются.
Спасибо.