Я работаю над проблемой классификации (предсказываю три класса) и сравниваю SVM со случайным лесом в R.
Для оценки и сравнения я хочу вычислить смещение и дисперсию моделей. Я посмотрел эти два термина во многих книгах по машинному обучению и скажу, что понимаю смысл дисперсии и предвзятости (самое простое объяснение с яблочком). Но я не могу понять, как применить это в моем случае.
Допустим, я предсказываю результаты для тестового набора с 4 SVM-моделями, которые были обучены с 4 различными тренировочными наборами. Каждый раз я получаю полную ошибку (имеется в виду все неправильные прогнозы / все прогнозы). Получу ли я тогда смещение для SVM, рассчитав это?
, что будет означать, что смещение является более или менее средним значением ошибок?
I надеюсь, вы поможете мне с не сложной формулой, потому что многие из них я уже видел.