Здесь необходимо понять, что параметр cv не относится к вашей модели, а скорее к тому, как вы собираетесь выполнять перекрестную проверку. В этом случае вы сравниваете 5-кратную с 10-кратной перекрестной проверкой.
Помните, что при перекрестной проверке вы пытаетесь оценить ошибку при применении вашего метода к общей совокупности. В случае линейной регрессии по методу наименьших квадратов, ошибка CV при отсутствии ответа будет асимптотически CV с наименьшим смещением + дисперсия. Однако на практике разница не будет слишком большой, это в основном имеет значение только для небольших размеров выборки.
Теперь, почему вам нужна оценка "ошибки теста"? Потому что, когда вы решаете большинство моделей, то, что вы пытаетесь минимизировать, это именно функция ошибок при применении к данным обучения, поэтому, если вы не будете осторожны и ваша модель слишком сложна, вы получите отличные результаты на ваших данных обучения, но нев популяции. Резюме сделано, чтобы убедиться, что этого не происходит. В линейной регрессии обычно вы делаете CV, изменяя число функций (прямой выбор или используйте что-то вроде лассо, если вы не возражаете заплатить некоторую цену за ошибку смещения), и исправляете cv = 5 (или10, в большинстве случаев это не имеет значения)