Есть ли способ классифицировать данные (предложения), не имея учебного набора данных в NL? - PullRequest
0 голосов
/ 24 мая 2019

Я пишу программу на python для классификации комментариев на простом английском языке для пункта меню на положительный, отрицательный и нейтральный. У меня нет тренировочного набора данных. Я очистил данные в Python, и он готов к классификации. Я работал с различными классификаторами, такими как NB и т. Д., Но они не работают, поскольку у меня нет набора данных для обучения для модели.

Может ли кто-нибудь помочь мне с тем, какой подход я должен использовать, чтобы классифицировать набор тестовых данных .?

Я пытался использовать nltk и sklearn, с Multinomial NB, сумкой слов и tfidf.

Я хочу, чтобы результаты для каждого отзыва / комментария отображались как «-1» для отрицательного значения, «0» для нейтрального и «+1» для положительного. Если бы я смог добиться еще большей детализации для вывода в терминах -0,7, -0,6, .. +0,3, +0,6 и т. Д., Это тоже было бы здорово.

...