Считаются ли настройки векторизации гиперпараметрами в ML? - PullRequest
0 голосов
/ 25 мая 2020

Краткое определение HP:

«В машинном обучении гиперпараметр - это параметр, значение которого устанавливается до начала процесса обучения. Оптимизация или настройка гиперпараметров - это проблема выбора набора оптимальных гиперпараметров для алгоритм обучения. »

Примеры HP:« альфа »в наивном байесе, C в SVM, nr. слоев в NN.

Я знаю, что эти гиперпараметры настраиваются на проверочном наборе (отличном от набора для обучения и тестирования)

Однако для классификации текста текст векторизуется перед обучением; с векторизацией также есть много настроек (например, функция max_features() в векторизаторе sklearn). Я обнаружил, что эти настройки векторизации сильно влияют на производительность обучения, проверки и набора тестов.

Мой вопрос: считаются ли настройки векторизации гиперпараметрами, если да, то это тот факт, что мы должны определить их до обучения, заключается в считается ограничением для моделирования обобщения?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...