Простым / наивным предложением было бы либо сначала разбить каждое предложение на отдельные слова, либо использовать регулярное выражение и отсканировать конкретные слова из обоих «положительных» списков (например, «как», «счастливый», «может»)., «делать» и т. д.) и «отрицательный» список («не нравится», «грустно», «не могу», «не надо»), определить, какой вариант более распространен в каждом предложении, и соответствующим образом выделить его.
В зависимости от ваших требований и набора данных этого может быть достаточно, или вы можете захотеть исследовать более продвинутые методы, такие как Байесовская фильтрация .