K-сгибы нам все еще нужно реализовать train_test_split? - PullRequest
0 голосов
/ 20 января 2020

Я читаю довольно много, и меня немного смущают k-фолды. Я понимаю концепцию, лежащую в основе этого, но я не уверен, как его развернуть.

Обычный шаг, который я видел после исследования данных, это train_test_split, кодирование и масштабирование fit_transform обучающие наборы и просто подгонка наборов для тестирования перед тестированием, какие алгоритмы работают. После чего они настраивают гиперпараметры.

Так что, если бы я использовал сейчас k-фолды, мне избежать использования train_test_split? И при чем мы используем k-сгибы?

Спасибо!

1 Ответ

1 голос
/ 20 января 2020

Нет. K-fold разделяет ваши данные на разбивку "поезд-тест" K раз, поэтому вы обучаете K разные модели.

Этот подход делает результаты вашей модели более надежными, поскольку вы обучаете K разные модели с разными частями ваш набор данных, а также вы прогнозируете различные части ваших данных K раз. Наконец, вы можете просто взять средний балл K модели.

...