Программа минимальной линейной регрессии - PullRequest
2 голосов
/ 05 февраля 2010

Я выполняю некоторые вычисления на внешнем компьютере, и в конце я получаю пары X, Y. Я хочу применить линейную регрессию и получить A, B и R2. На этой машине я не могу ничего установить (работает под управлением Linux) и на нем установлены базовые компоненты: python, bash (конечно) и т. Д.

Интересно, как лучше всего использовать скрипт (python, bash и т. Д.) Или программу (я могу скомпилировать C и C ++), которая дает мне коэффициенты линейной регрессии без необходимости добавлять внешние библиотеки (numpy и т. Д.) )

Ответы [ 3 ]

3 голосов
/ 05 февраля 2010

Для одной простой, известной функции (как в вашем случае: строка) нетрудно просто написать базовую процедуру наименьших квадратов с нуля (но требует некоторого внимания к деталям). Это очень распространенное задание во вводных классах числового анализа.

Итак, ищите наименьших квадратов в Википедии, на математике или в учебнике и отправляйтесь в город.

1 голос
/ 31 января 2017

Привет, вот мое решение, которое я получил из статьи в Википедии о линии наилучшего соответствия.

#include <iostream>
#include <vector>

// Returns true if linear fit was calculated. False otherwise.
// Algorithm adapted from:
// https://en.wikipedia.org/wiki/Simple_linear_regression#Fitting_the_regression_line
template <typename PairIterator>
bool GetLinearFit(PairIterator begin_it,
                  PairIterator end_it,
                  double* out_slope,
                  double* out_yintercept) {

    if (begin_it == end_it) {
        return false;
    }

    size_t n = 0;
    double x_avg = 0;
    double y_avg = 0;

    for (PairIterator it = begin_it; it != end_it; ++it) {
        x_avg += it->first;
        y_avg += it->second;
        n++;
    }

    x_avg /= n;
    y_avg /= n;

    double numerator = 0;
    double denominator = 0;

    for (PairIterator it = begin_it; it != end_it; ++it) {
        double x_variance = it->first - x_avg;
        double y_variance = it->second - y_avg;
        numerator += (x_variance * y_variance);
        denominator += (x_variance * x_variance);
    }

    double slope = numerator / denominator;
    double yintercept = y_avg - slope*x_avg;

    *out_slope = slope;
    *out_yintercept= yintercept ;

    return true;
}

// Tests the output of GetLinearFit(...).
int main() {
    std::vector<std::pair<int, int> > data;
    for (int i = 0; i < 10; ++i) {
      data.push_back(std::pair<int, int>(i+1, 2*i));
    }

    double slope = 0;
    double y_intercept = 0;
    GetLinearFit(data.begin(), data.end(), &slope, &y_intercept);

    std::cout << "slope: " << slope << "\n";
    std::cout << "y_intercept: " << y_intercept<< "\n";

    return 0;
}
1 голос
/ 05 февраля 2010

Как насчет извлечения коэффициентов в файл, импорта на другую машину и затем использования Excel / Matlab / любой другой программы, которая делает это для вас?

...