Я пытаюсь построить модель, которая предсказывает сортовое вино (тип винограда) из текстового обзора вина (например, в наборе данных обзоров вина Kaggle). Я извлек основные ключевые слова из текстового обзора, который использовался в каждом описании вина, и здесь используется более ста терминов.
Поэтому я подумал, что построить модель будет несложно, однако я я в тупик о том, как на самом деле действовать. Если я в один прекрасный момент закодирую ключевые слова для каждого вина, я получу большое количество столбцов, с которыми, я думаю, я мог бы работать. Однако мне кажется, что я должен быть в состоянии взять список ключевых слов, связанных с каждым вином, и выполнить «распознавание вина» так же, как устройство распознавания изображений.
Какой алгоритм ML сможет принимать списки ключевых слов для предсказать цель?
Спасибо за любые советы.