Как вписать данные в журнал нормального CDF - PullRequest
0 голосов
/ 17 мая 2019

Я новый пользователь Python, и я пытаюсь согласовать некоторые экспериментальные данные с CDF. Данные приведены ниже, и они должны быть построены в логарифмическом масштабе по оси X:

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

x=np.array([0.995, 3.003, 5.908, 10.525, 13.617, 24.321, 33.917, 47.843, 64.172, 91.353, 126.745, 174.118, 225.059, 292.998, 369.133, 640.295, 828.169, 1255.39, 1496.613, 1942.785])

y=np.array([0.142, 0.2, 0.25, 0.36, 0.498, 0.616, 0.599, 0.7, 0.835, 1.102, 1.083, 1.225, 1.133, 1.165, 1.298, 1.365, 1.298, 1.373, 1.409, 1.538])

pyplot.xscale('log')

plt.plot(x,y,'r.')

Я нашел свидетельство от такого же пользователя, который установил данные, используя следующий подход:

from scipy.special import erf
from lmfit import Model

def gaussian_cdf(x,amp,mu,sigma):
    return (amp/2.0)*(1+erf((mu-x)/(sigma*np.sqrt(2.0))))


model = Model(gaussian_cdf,prefix='g1_') + Model(gaussian_cdf,prefix='g2_')

params = model.make_params(g1_amp=0.50,g1_mu=94,g1_sigma=1.,
                          g2_amp=0.50,g2_mu=98,g2_sigma=1.)

params['g1_sigma'].min=0
params['g2_sigma'].min=0

result = model.fit(y,params,x = x)

print(result.fit_report())

comps=result.eval_components(result.params,x=x)


plt.plot(x,y,'r.',label='data')
plt.plot(x,result.best_fit,'k-',label='fit')
plt.plot(x,comps['g1_'],'b--',label='g1_')
plt.plot(x,comps['g2_'],'g--',label='g2_')
plt.legend()
plt.show()

введите описание изображения здесь

Но когда я пытаюсь адаптировать этот код к моей собственной проблеме (чьи данные показаны выше), которая имеет дело с распределениями LogNormal pdf и cdf, результат не очень хороший.

введите описание изображения здесь

Если бы кто-то мог помочь мне с этим, я был бы очень признателен!

Заранее спасибо

1 Ответ

0 голосов
/ 19 мая 2019

Вы можете разместить строку вида y = a * log10 (b * x + h) + k (которая, кажется, соответствует вашим данным лучше, чем нормальное логарифмическое распределение), используя scipy.optimize.curve_fit и определение вашей функции журнала.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import lognorm
from scipy.optimize import curve_fit

x=np.array([0.995, 3.003, 5.908, 10.525, 13.617, 24.321, 33.917, 47.843, 64.172, 91.353, 126.745, 174.118, 225.059, 292.998, 369.133, 640.295, 828.169, 1255.39, 1496.613, 1942.785])

y=np.array([0.142, 0.2, 0.25, 0.36, 0.498, 0.616, 0.599, 0.7, 0.835, 1.102, 1.083, 1.225, 1.133, 1.165, 1.298, 1.365, 1.298, 1.373, 1.409, 1.538])

def log(x, a, b, h, k):
    return a*np.log10(b*x + h) + k

# Provide guesses to the parameters
params = [6, 1, 0, 0]#, .2]
popt, pcov = curve_fit(log, x, y, p0=params)

plt.plot(x,y,'r.')
plt.plot(x, log(x, *popt), 'k--', label = 'fit: a = %.2f b = %.2f h = %.2f k = %.2f ' 
% tuple(popt)) #locl = %.2f scale = %.2f
plt.legend(loc = 'lower right')
#plt.xscale('log')
plt.show()

Без лог-шкалы вы получите подгонку, которая выглядит как

enter image description here

В логарифмическом масштабе ваша посадка выглядит как

enter image description here

...