scipy.optimize_curvefit дает плохие результаты - PullRequest
0 голосов
/ 17 января 2019

Я пытаюсь подобрать модель материала (Carreau-Law). Обычно данные выглядят очень хорошо, но невозможно (по крайней мере, для меня) получить правильные данные модели и параметры с curve_fit. Я пытался установить разумные начальные значения и т. Д.

import numpy as np
import matplotlib.pyplot as plt

## Y-DATA
eta = np.array([7128.67, 6814, 6490, 6135.67, 5951.67,
        5753.67, 5350, 4929.33, 4499.33,4068.67, 3641.33,
        3225.33, 2827.33, 2451, 2104.67, 1788, 1503, 1251.33,
        1032.33, 434.199, 271.707, 134.532, 75.7034, 40.9144, 21.7112, 14.9206, 9.29772])


##X-DATA
gamma = np.array([0.1, 0.1426, 0.2034, 0.29, 0.4135, 0.5897, 0.8409, 1.199,
         1.71, 2.438, 3.477, 4.959, 7.071, 10.08, 14.38, 20.5,
         29.24, 41.7, 59.46, 135.438, 279.707, 772.93,
         1709.91, 3734.32, 8082.32, 12665.8, 22353.3])


carreaulaw = lambda x, eta_0, lam, a, n: eta_0 / (1 + (lam * x)**a)**((n-1)/a)

popt, pcov = sp.optimize.curve_fit(carreaulaw, gamma, eta, p0=[8000, 3000, 0.8, 0.1])

print(popt)

x = np.linspace(gamma.min(), gamma.max(), 500)
fig = plt.figure()
diagram = fig.add_axes([0.1, 0.1, 0.8, 0.8])
diagram.set_xlabel(r"$log\ \. \gamma_{true}\ (s^{-1})$", fontsize = 12)
diagram.set_ylabel(r"$log\ \eta_{true}\ (Pa*s)$",fontsize = 12)
#diagram.set_xscale("log")
#diagram.set_yscale("log")
diagram.plot(gamma, eta, "r*")
diagram.plot(x, carreaulaw(x, popt[0], popt[1], popt[2], popt[3]), "g-")

Я постоянно получаю сообщение об ошибке: RuntimeWarning: invalid value encountered in power. Я уже пробовал много вариантов, и сейчас я застрял.

Если я не дам никаких начальных значений, я получу:

RuntimeError: Optimal parameters not found: Number of calls to function has reached maxfev = 1000.

Вот изображение данных в масштабе log-log:

Original data on log-log scale

Я действительно не знаю, где я ошибаюсь! Данные выглядят довольно хорошо, поэтому у меня никогда не должно заканчиваться maxfev.

Ответы [ 2 ]

0 голосов
/ 17 января 2019

Все, что вам нужно сделать, это передать границы в curve_fit. Если границы не определены, вы можете выполнять нереальные операции, такие как (в вашем случае) возведение в степень с плавающей точкой отрицательного числа.

Границы просто определяются как списки из двух списков / кортежей с нижними и верхними границами:

bounds = [(-np.inf, 0, 0, 0), [np.inf, np.inf, 1, 1]]   #upper np.inf or lower -np.inf means no bound
popt, pcov = curve_fit(carreaulaw, gamma, eta, p0=[8000, 3000, 0.8, 0.1], bounds=bounds)

Выход:

enter image description here

0 голосов
/ 17 января 2019

Вот графическое приспособление, использующее ваши данные и уравнение. В этом примере кода используется генетический алгоритм Scipy's diffrential Evolution для определения начальных оценок параметров для curve_fit (). Этот модуль scipy использует алгоритм Latin Hypercube, чтобы обеспечить тщательный поиск пространства параметров, для которого требуются границы для поиска. Гораздо легче найти диапазоны для параметров, чем отдельные значения, и здесь я экспериментировал с различными границами, пока подгонка визуально не выглядела хорошо для меня. Вы должны проверить границы, которые я использовал, и посмотреть, кажутся ли они разумными.

plot

import numpy, scipy, matplotlib
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
from scipy.optimize import differential_evolution
import warnings

xData = numpy.array([7128.67, 6814, 6490, 6135.67, 5951.67,
        5753.67, 5350, 4929.33, 4499.33,4068.67, 3641.33,
        3225.33, 2827.33, 2451, 2104.67, 1788, 1503, 1251.33,
        1032.33, 434.199, 271.707, 134.532, 75.7034, 40.9144, 21.7112, 14.9206, 9.29772])

yData = numpy.array([0.1, 0.1426, 0.2034, 0.29, 0.4135, 0.5897, 0.8409, 1.199,
         1.71, 2.438, 3.477, 4.959, 7.071, 10.08, 14.38, 20.5,
         29.24, 41.7, 59.46, 135.438, 279.707, 772.93,
         1709.91, 3734.32, 8082.32, 12665.8, 22353.3])

def carreaulaw(x, eta_0, lam, n, a):
    return eta_0 * (1.0+(lam*x)**a)**((n-1.0)/a)


# function for genetic algorithm to minimize (sum of squared error)
def sumOfSquaredError(parameterTuple):
    warnings.filterwarnings("ignore") # do not print warnings by genetic algorithm
    val = carreaulaw(xData, *parameterTuple)
    return numpy.sum((yData - val) ** 2.0)


def generate_Initial_Parameters():

    parameterBounds = []
    parameterBounds.append([0.0, 50.0]) # search bounds for eta_0
    parameterBounds.append([0.0, 1.0]) # search bounds for lam
    parameterBounds.append([-1.0, 0.0]) # search bounds for n
    parameterBounds.append([-200.0, 0.0]) # search bounds for a

    # "seed" the numpy random number generator for repeatable results
    result = differential_evolution(sumOfSquaredError, parameterBounds, seed=3)
    return result.x

# by default, differential_evolution completes by calling curve_fit() using parameter bounds
geneticParameters = generate_Initial_Parameters()

# now call curve_fit without passing bounds from the genetic algorithm,
# just in case the best fit parameters are aoutside those bounds
fittedParameters, pcov = curve_fit(carreaulaw, xData, yData, geneticParameters)
print('Fitted parameters:', fittedParameters)
print()

modelPredictions = carreaulaw(xData, *fittedParameters) 

absError = modelPredictions - yData

SE = numpy.square(absError) # squared errors
MSE = numpy.mean(SE) # mean squared errors
RMSE = numpy.sqrt(MSE) # Root Mean Squared Error, RMSE
Rsquared = 1.0 - (numpy.var(absError) / numpy.var(yData))

print()
print('RMSE:', RMSE)
print('R-squared:', Rsquared)

print()


##########################################################
# graphics output section
def ModelAndScatterPlot(graphWidth, graphHeight):
    f = plt.figure(figsize=(graphWidth/100.0, graphHeight/100.0), dpi=100)
    axes = f.add_subplot(111)

    # first the raw data as a scatter plot
    axes.plot(xData, yData,  'D')

    # create data for the fitted equation plot
    xModel = numpy.linspace(min(xData), max(xData))
    yModel = carreaulaw(xModel, *fittedParameters)

    # now the model as a line plot
    axes.plot(xModel, yModel)

    axes.set_xlabel('X Data') # X axis data label
    axes.set_ylabel('Y Data') # Y axis data label

    plt.show()
    plt.close('all') # clean up after using pyplot

graphWidth = 800
graphHeight = 600
ModelAndScatterPlot(graphWidth, graphHeight)
...