Компьютеры не знают ничего о человеке, таком как чувство , если только они не узнают об этом из примеров, которые человек пометил как положительные или отрицательные.из Машинное обучение фактически является наиболее информированным решением о новом примере, основанном на эмпирических данных предыдущих примеров.Статистически, чем больше данных, тем лучше.
Чтобы «судить» о смысле предложения, вам необходимо обучить модель или классификатор на некоторыхпредложения помечены для чувства.Классификатор принимает предложение без метки в качестве входных данных и выводит метку: положительную или отрицательную.
Сначала получите обучающие примеры.Я уверен, что вы можете найти некоторые данные о настроениях в открытом доступе. Одним из лучших репозиториев наборов данных является UCI KDD Archive .Затем вы можете обучить классификатор на данных, чтобы судить новые примеры.Есть множество доступных ресурсов алгоритма обучения.Мои любимые jBoost , которые могут выводить классификатор в виде кода Java и Rapidminer , что лучше для визуального анализа.