Вам не нужно делать ничего, что вы не хотите делать :-). Но, вообще говоря, вы захотите как-то справиться с такими вещами, как мультиколлинеарность, но это не обязательно означает уменьшение размерности.
Какова форма ваших данных? Если у вас есть, скажем, 20 объектов, но 10 тыс. Наблюдений, не нужно уменьшать размерность (по крайней мере, не в первом проходе).
Но если у вас есть, например, 1 тыс. Объектов и 10 тыс. Наблюдений, то Вы будете хорошо подходить для неконтролируемого шага по уменьшению размерности перед учеником.
Возможно, вы захотите сначала попробовать некоторую регуляризацию (см. https://web.stanford.edu/~hastie/ElemStatLearn/ - вы можете скачать книгу бесплатно оттуда).
Так, например, попробуйте использовать класс ElasticNet
вместо класса LinearRegression
. Это почти то же самое, но со штрафом к нормам весов $ L_1 $ и $ L_2 $. Это может помочь с обобщением.
Не зная гораздо больше о вашей конкретной проблеме, трудно сказать что-либо еще.