Правильный способ настройки параметра C SVM - PullRequest
0 голосов
/ 22 сентября 2018

У меня есть набор данных, который имеет три разделения (обучение-проверка-проверка).Каков наилучший способ настройки параметра C?Тренируюсь ли я на тренинге и оцениваю на разделе валидации?Правильно ли выполнять k-кратную проверку, когда у вас уже есть искаженные данные?

Любое объяснение будет по-настоящему оценено.Спасибо,

1 Ответ

0 голосов
/ 27 сентября 2018

Я обычно не делю свои данные на 3 части.Я случайно использую 20% данных о поездах для проверки в 5-10 итераций и проверяю точность с разными C.

Предположим, что я проверяю 5 итераций и 4 разных C:

**Iteration**           **C**        **Accuracy**
1                        10            92
1                        1             91.23
1                        0.1           90.9
1                        0.01          89.88

Точно так же я делаю это еще для 5 итераций (каждая итерация устанавливает новый набор проверки случайным образом из данных поезда), и в качестве лучшего параметра выбирается значение C с самой высокой средней точностью по различным итерациям.

В качестве альтернативы, Вы можетеиспользуйте GridSearchCV или RandomizedSearchCV для достижения того же.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...