Использование AutoML для оценки гиперпараметров алгоритма Word2Vec - PullRequest
0 голосов
/ 26 марта 2019

Можно ли с помощью AutoML (из H2O) использовать только алгоритм Word2Vec и опробовать различные значения параметров, чтобы выяснить, какие настройки параметров дают мне наиболее точные векторы для моего набора данных?Поэтому я не хочу, чтобы AutoML применял алгоритмы DeepLearning, GBM и т. Д. К моему набору данных.Только алгоритм Word2Vec ... Как мне это сделать?

Пока мне удалось построить модель word2vec только с H2O.

Я хотел бы протестировать различные настройки гиперпараметров Word2Vec с AutoML, чтобы оценить, какие настройки являются оптимальными ...

1 Ответ

0 голосов
/ 26 марта 2019

Алгоритм Word2Vec - это алгоритм преобразования данных (преобразование строк текста в матрицу), а не контролируемый алгоритм машинного обучения (это то, что делает AutoML и все алгоритмы внутри него).

Типичный способ использования Word2Vec - это применение Word2Vec к вашим текстовым данным, чтобы их можно было использовать для обучения алгоритму ML под наблюдением.Отсюда вы можете запустить любой контролируемый алгоритм (GLM, Random Forest, GBM и т. Д.) Для этого преобразованного набора данных - или я рекомендую просто передать преобразованные данные в AutoML, чтобы он мог найти лучший алгоритм для вас.

Вам придется вручную опробовать различные настройки для Word2Vec и посмотреть, насколько хорошо они работают, учитывая какой-то определенный контролируемый алгоритм обучения, который вы хотите применить к своей проблеме.Надеюсь, это прояснит ситуацию.

...