Выбор алгоритма прогнозирования из списков терминов - PullRequest
0 голосов
/ 23 апреля 2020

Я пытаюсь построить модель, которая предсказывает сортовое вино (тип винограда) из текстового обзора вина (например, в наборе данных обзоров вина Kaggle). Я извлек основные ключевые слова из текстового обзора, который использовался в каждом описании вина, и здесь используется более ста терминов.

Поэтому я подумал, что построить модель будет несложно, однако я я в тупик о том, как на самом деле действовать. Если я в один прекрасный момент закодирую ключевые слова для каждого вина, я получу большое количество столбцов, с которыми, я думаю, я мог бы работать. Однако мне кажется, что я должен быть в состоянии взять список ключевых слов, связанных с каждым вином, и выполнить «распознавание вина» так же, как устройство распознавания изображений.

Какой алгоритм ML сможет принимать списки ключевых слов для предсказать цель?

Спасибо за любые советы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...