Question

У меня есть набор данных, который имеет три разделения (обучение-проверка-проверка).Каков наилучший способ настройки параметра C?Тренируюсь ли я на тренинге и оцениваю на разделе валидации?Правильно ли выполнять k-кратную проверку, когда у вас уже есть искаженные данные?

Любое объяснение будет по-настоящему оценено.Спасибо,

Ashis Nayak · Answer 1 · 27 сентября 2018

Я обычно не делю свои данные на 3 части.Я случайно использую 20% данных о поездах для проверки в 5-10 итераций и проверяю точность с разными C.

Предположим, что я проверяю 5 итераций и 4 разных C:

**Iteration**           **C**        **Accuracy**
1                        10            92
1                        1             91.23
1                        0.1           90.9
1                        0.01          89.88

Точно так же я делаю это еще для 5 итераций (каждая итерация устанавливает новый набор проверки случайным образом из данных поезда), и в качестве лучшего параметра выбирается значение C с самой высокой средней точностью по различным итерациям.

В качестве альтернативы, Вы можетеиспользуйте GridSearchCV или RandomizedSearchCV для достижения того же.

Правильный способ настройки параметра C SVM

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Правильный способ настройки параметра C SVM

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы