Из памяти это превращается в проблему собственных векторов. Расстояние от точки до вашей плоскости пропорционально Ax + By + Cz + D - один из способов увидеть это - заметить, что нормаль к плоскости равна (A, B, C). Константа D - это боль в шее, но я думаю, что вы можете избавиться от нее, переопределив свои переменные, чтобы сместить ее в постоянную, чтобы все имело значение 0. В этом случае я думаю, что лучшая подходящая плоскость пройдет через начало координат .
Затем вы обнаружите, что хотите минимизировать SUM_i (X_i. A) ^ 2, где A - 3-вектор. Конечно, вы можете сделать это сколь угодно малым, умножив все компоненты A на некоторый небольшой скаляр, поэтому вы хотите минимизировать этот предмет с учетом ограничения, например, || A || ^ 2 = 1, что имеет смысл пропорциональности, делая A единичным вектором.
(X_i. A) ^ 2 = A '(X_i' X) A, поэтому вы хотите свести к минимуму
A '(SUM_i (X_i'X_i)) A Итак, я думаю, что вы хотите минимальный собственный вектор SUM_i X_i'X_i
Одна из причин, по которой это не используется чаще в статистике, заключается в том, что полученный вами ответ изменится, если вы масштабируете единицы любого из векторов координат без аналогичного масштабирования единиц в других направлениях на ту же величину.
Если подумать, вы можете увидеть, как все это работает правильно на http://en.wikipedia.org/wiki/Total_least_squares