Как выполнить алгоритм регрессии на текстовых данных (обзоры IMDB)? - PullRequest
0 голосов
/ 27 января 2019
                 reviews              label
0   i admit the great majority of...    1
1   take a low budget inexperienced ... 0
2   everybody has seen back to th...    1
3   doris day was an icon of b...       0
4   after a series of silly fun ...     0

У меня есть данные из обзоров фильмов и столбец метки (1-положительный, 0-отрицательный отзыв)

У меня есть еще один аналогичный набор тестовых данных только с колонкой отзывов

Мне нужно построить модель анализа настроений с использованием линейной регрессии для прогнозирования столбца меток тестового фрейма данных

Требуемый вывод: тестировать фрейм данных со столбцом меток

Регрессия выполняется на числовых данных, как конвертироватьтекстовый обзор в числовой форме, чтобы иметь возможность соответствовать его?

1 Ответ

0 голосов
/ 27 января 2019

Вам нужно преобразовать ваши слова в векторы, технику, известную как word2vec.Вот ссылка, объясняющая технику

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...