У меня есть простая проблема НЛП, где у меня есть несколько письменных обзоров, которые имеют простое бинарное положительное или отрицательное суждение.В этом случае я могу обучать и тестировать как независимые переменные столбцы X, содержащие «мешки слов», а именно отдельные слова в разреженной матрице.
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer(max_features = 300)
#indipendent
X = cv.fit_transform(corpus).toarray()
#dependent
y = dataset.iloc[:, 1].values
.. и зависимую переменнуюy, это представлено столбцом 1, который принимает значения как 0 и 1 (таким образом, в основном положительный и отрицательный отзыв).
если вместо 0 и 1 у меня есть отзывы, за которые можно проголосовать от 1 до 5 звездпродолжить ли мне иметь столбец переменной y со значениями от 0 до 4. Другими словами, я бы соврал узнать, насколько отличается модель, если вместо бинарного хорошего / плохого обзора у пользователя есть возможность после своего обзора датьоценка от 1 до 5. Как называется такая проблема в машинном обучении?