Как правильно тренировать модель в Google NLP Sentiment Analysis - PullRequest
0 голосов
/ 03 июня 2019

Мне нужно сравнить с настроениями моделей, обученных с различными типами контента.Google предоставляет вам обучающий набор данных, заполненный твитами в файле .csv. Как и ожидалось, обучение с этим прошло хорошо, однако, когда я решил обучить модель с использованием набора данных обзоров IMDB из Stanford NLP, мне удалось загрузить набор данных без проблем, нокогда я обучаю его НЛП, по какой-то причине только предсказывает, что значение настроения равно 2, независимо от того, что я пишу.

Я полагал, что набор данных был разбавлен, поскольку, хотя было 800-2000 примеров настроений 0,1,3 и 4, было 6000 примеров настроений 2. Хотя после удаления 4000 из этих примеров проблемасохранялось.

Я ожидаю, что моя матрица путаницы не просто будет иметь 100% -ый прогноз по каждому значению настроения.Должно быть распределено по матрице

...