Подгонка линии в 3D - PullRequest
       14

Подгонка линии в 3D

19 голосов
/ 19 февраля 2010

Существуют ли алгоритмы, которые будут возвращать уравнение прямой линии из набора трехмерных точек данных? Я могу найти множество источников, которые дадут уравнение линии из двухмерных наборов данных, но ни одного из них в трехмерном.

Спасибо.

Ответы [ 2 ]

42 голосов
/ 25 февраля 2010

Если вы пытаетесь предсказать одно значение из двух других, то вы должны использовать lstsq с аргументом a в качестве независимых переменных (плюс столбец 1 для оценки перехвата) и b в качестве вашегозависимая переменная.

Если, с другой стороны, вы просто хотите получить наилучшую линию подгонки к данным, то есть линию, которая, если вы спроецируете данные на нее, сведет к минимуму квадратное расстояние между реальной точкой и еепроекция, то, что вы хотите, это первый главный компонент.

Один из способов определить ее - это линия, вектор направления которой является собственным вектором ковариационной матрицы, соответствующей наибольшему собственному значению, которое проходит через среднее значение ваших данных.Тем не менее, eig(cov(data)) - это действительно плохой способ его вычисления, поскольку он выполняет много ненужных вычислений и копий и потенциально менее точен, чем использование svd.Смотрите ниже:

import numpy as np

# Generate some data that lies along a line

x = np.mgrid[-2:5:120j]
y = np.mgrid[1:9:120j]
z = np.mgrid[-5:3:120j]

data = np.concatenate((x[:, np.newaxis], 
                       y[:, np.newaxis], 
                       z[:, np.newaxis]), 
                      axis=1)

# Perturb with some Gaussian noise
data += np.random.normal(size=data.shape) * 0.4

# Calculate the mean of the points, i.e. the 'center' of the cloud
datamean = data.mean(axis=0)

# Do an SVD on the mean-centered data.
uu, dd, vv = np.linalg.svd(data - datamean)

# Now vv[0] contains the first principal component, i.e. the direction
# vector of the 'best fit' line in the least squares sense.

# Now generate some points along this best fit line, for plotting.

# I use -7, 7 since the spread of the data is roughly 14
# and we want it to have mean 0 (like the points we did
# the svd on). Also, it's a straight line, so we only need 2 points.
linepts = vv[0] * np.mgrid[-7:7:2j][:, np.newaxis]

# shift by the mean to get the line in the right place
linepts += datamean

# Verify that everything looks right.

import matplotlib.pyplot as plt
import mpl_toolkits.mplot3d as m3d

ax = m3d.Axes3D(plt.figure())
ax.scatter3D(*data.T)
ax.plot3D(*linepts.T)
plt.show()

Вот как это выглядит: a 3d plot of a fitted line

3 голосов
/ 21 февраля 2010

Если ваши данные довольно хорошо себя ведут, то должно быть достаточно найти сумму наименьших квадратов расстояний между компонентами. Затем вы можете найти линейную регрессию с z, не зависящим от x, а затем снова не зависящим от y.

В соответствии с документацией пример:

import numpy as np

pts = np.add.accumulate(np.random.random((10,3)))
x,y,z = pts.T

# this will find the slope and x-intercept of a plane
# parallel to the y-axis that best fits the data
A_xz = np.vstack((x, np.ones(len(x)))).T
m_xz, c_xz = np.linalg.lstsq(A_xz, z)[0]

# again for a plane parallel to the x-axis
A_yz = np.vstack((y, np.ones(len(y)))).T
m_yz, c_yz = np.linalg.lstsq(A_yz, z)[0]

# the intersection of those two planes and
# the function for the line would be:
# z = m_yz * y + c_yz
# z = m_xz * x + c_xz
# or:
def lin(z):
    x = (z - c_xz)/m_xz
    y = (z - c_yz)/m_yz
    return x,y

#verifying:
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt

fig = plt.figure()
ax = Axes3D(fig)
zz = np.linspace(0,5)
xx,yy = lin(zz)
ax.scatter(x, y, z)
ax.plot(xx,yy,zz)
plt.savefig('test.png')
plt.show()

Если вы хотите минимизировать фактические ортогональные расстояния от линии (ортогональные к линии) до точек в 3-мерном пространстве (что я не уверен, даже называют линейной регрессией) Затем я бы собрал функцию, которая вычисляет RSS и использовал бы функцию минимизации scipy.optimize для ее решения.

...