Этот вопрос не имеет большого смысла.
Давайте посмотрим на определение коэффициента детерминации (то есть "R в квадрате"):
R^2 = 1 - sum(e_i) / ((n - 1) * s^2)
где sum(e_i)
- сумма квадратов невязок, а s^2
- выборочная дисперсия.
Добавление все большего и большего числа предикторов потенциально сократит сумму квадратов невязок, но даст плохую прогнозирующую производительность из-зак переоснащению.
Поэтому критический вопрос здесь будет следующим: какие особенности (переменные) важны для вашей лучшей модели с высокой прогнозирующей эффективностью.
Этот вопрос будет выходить далеко за рамки SO (или любого другогодругой форум), и я рекомендую (любой) учебник по статистическому моделированию.