Я ищу способ выполнить (среднюю *) многомерную линейную регрессию (обычный метод наименьших квадратов, OLS) на C ++ . Скажем, C ++ 11 с использованием библиотеки std
и, если полезно, также boost
; если их легко установить, можно использовать и другие библиотеки; использование, например, формата std::vector
для входов и выходов может быть наиболее удобным.
Производительность не является высшим приоритетом, хотя, конечно, приветствуется.
Как выглядит разумный алгоритм? Существуют ли какие-либо хорошие инструменты, которые могут помочь с этим?
Можно легко найти различные реализации для одномерных алгоритмов регрессии, например здесь , но я еще не нашел любая многовариантная версия. Кроме того, этот вопрос, по сути, требует такой регрессии, хотя он был закрыт из-за недостаточной фокусировки, даже если его заголовок был бы идеальным.
* Средний масштаб : в моем случае, например, скажем, несколько десятков тысяч наблюдений и до сотни пояснений / атрибутов (например, фиктивных значений времени).