Краткое определение HP:
«В машинном обучении гиперпараметр - это параметр, значение которого устанавливается до начала процесса обучения. Оптимизация или настройка гиперпараметров - это проблема выбора набора оптимальных гиперпараметров для алгоритм обучения. »
Примеры HP:« альфа »в наивном байесе, C в SVM, nr. слоев в NN.
Я знаю, что эти гиперпараметры настраиваются на проверочном наборе (отличном от набора для обучения и тестирования)
Однако для классификации текста текст векторизуется перед обучением; с векторизацией также есть много настроек (например, функция max_features()
в векторизаторе sklearn). Я обнаружил, что эти настройки векторизации сильно влияют на производительность обучения, проверки и набора тестов.
Мой вопрос: считаются ли настройки векторизации гиперпараметрами, если да, то это тот факт, что мы должны определить их до обучения, заключается в считается ограничением для моделирования обобщения?