умный оптимизатор - PullRequest
0 голосов
/ 22 июня 2010

Мне нужно совместить некоторые точки из разных наборов данных с прямыми линиями. Из каждого набора данных я хочу соответствовать линии. Итак, я получил параметры ai и bi, которые описывают i-line: ai + bi * x. Проблема в том, что я хочу навязать, что все ai равны, потому что я хочу, чтобы один и тот же intercepta. Я нашел здесь учебник: http://www.scipy.org/Cookbook/FittingData#head-a44b49d57cf0165300f765e8f1b011876776502f. Разница в том, что я не знаю, сколько у меня данных. Мой код такой:

from numpy import *
from scipy import optimize

# here I have 3 dataset, but in general I don't know how many dataset are they
ypoints = [array([0, 2.1, 2.4]),    # first dataset, 3 points
           array([0.1, 2.1, 2.9]),  # second dataset
           array([-0.1, 1.4])]      # only 2 points

xpoints = [array([0, 2, 2.5]),      # first dataset
           array([0, 2, 3]),        # second, also x coordinates are different
           array([0, 1.5])]         # the first coordinate is always 0

fitfunc = lambda a, b, x: a + b * x
errfunc = lambda p, xs, ys: array([ yi - fitfunc(p[0], p[i+1], xi) 
                                    for i, (xi,yi) in enumerate(zip(xs, ys)) ])


p_arrays = [r_[0.]] * len(xpoints)
pinit = r_[[ypoints[0][0]] + p_arrays]
fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints, ypoints))

Я получил

Traceback (most recent call last):
  File "prova.py", line 19, in <module>
    fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints,    ypoints))
  File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 266, in  leastsq
    m = check_func(func,x0,args,n)[0]
  File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 12, in  check_func
    res = atleast_1d(thefunc(*((x0[:numinputs],)+args)))
  File "prova.py", line 14, in <lambda>
    for i, (xi,yi) in enumerate(zip(xs, ys)) ])
ValueError: setting an array element with a sequence.

Ответы [ 2 ]

1 голос
/ 28 июня 2010

если вам просто нужно линейное приближение, то лучше оценить его с помощью линейной регрессии, а не нелинейного оптимизатора. Более подходящую статистику можно получить, используя взамен scikits.statsmodels.

import numpy as np
from numpy import array

ypoints = np.r_[array([0, 2.1, 2.4]),    # first dataset, 3 points
           array([0.1, 2.1, 2.9]),  # second dataset
           array([-0.1, 1.4])]      # only 2 points

xpoints = [array([0, 2, 2.5]),      # first dataset
           array([0, 2, 3]),        # second, also x coordinates are different
           array([0, 1.5])]         # the first coordinate is always 0

xp = np.hstack(xpoints)
indicator = []
for i,a in enumerate(xpoints):
    indicator.extend([i]*len(a))

indicator = np.array(indicator)


x = xp[:,None]*(indicator[:,None]==np.arange(3)).astype(int)
x = np.hstack((np.ones((xp.shape[0],1)),x))

print np.dot(np.linalg.pinv(x), ypoints)
# [ 0.01947973  0.98656987  0.98481549  0.92034684]

Матрица регрессоров имеет общий перехват, но разные столбцы для каждого набора данных:

>>> x
array([[ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  2. ,  0. ,  0. ],
       [ 1. ,  2.5,  0. ,  0. ],
       [ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  0. ,  2. ,  0. ],
       [ 1. ,  0. ,  3. ,  0. ],
       [ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  0. ,  0. ,  1.5]])
1 голос
/ 22 июня 2010

(Примечание: используйте def, а не lambda, присвоенное имени - это совершенно глупо и не имеет ничего, кроме недостатков, lambda использует только анонимные функции!).

Ваш errfunc должен возвращать последовательность (массив или другое) чисел с плавающей запятой, но это не так, потому что вы пытаетесь поместить в качестве элементов своих массивов массивы, которые являются отличиями каждого y point (помните, ypoints aka ys - список массивов!) И результаты подбора функций.Поэтому вам нужно «свернуть» выражение yi - fitfunc(p[0], p[i+1], xi) в одно число с плавающей запятой, например norm(yi - fitfunc(p[0], p[i+1], xi)).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...