Большинство веб-сайтов, которые вы видите, используют общую технику под названием извлечение настроений . Существует много возможных реализаций, но простой (несколько наивный) состоит в создании списка «плохих» слов («не должен», «злой», «злой», «аллергический») и списка «хороших» слова («счастье», «радостный», «улыбающийся», «чудесный»). Назначьте "оценку настроения" каждому слову (или просто -1 плохим словам и +1 хорошим словам). Общая оценка "настроение".
Это наивный подход, потому что многие слова требуют контекста, чтобы понять. (Например, бостонец, описывающий что-то как «нечестивое добро», делает вдвойне положительное замечание, не исключая следующего слова.) Тем не менее, это может подойти для ваших целей.