Библиотека для классификации текста по влиянию - PullRequest
1 голос
/ 25 октября 2011

Существуют ли библиотеки для автоматической классификации текста, например, на английском языке на аффекте?Если он довольно грубый, он все равно может быть достаточно хорошим.

Ответы [ 2 ]

2 голосов
/ 25 октября 2011

Обычно, когда я вижу используемый термин "классификация аффектов", описывающий обработку голосовых данных, а не текста, - используя звуковые функции, такие как спектр, громкость и т. Д., Чтобы определить, является ли говорящий раздраженным, расстроенным и т. Д. типы функций, очевидно, плохо переводятся в текст.

Говоря о классификации текста, чаще всего ссылаются на классификацию Настроения , или «Мнение», чтобы определить, говорит ли автор текста положительно или отрицательно о предмете текста. Если это обеспечивает достаточно нюансов для ваших нужд, к счастью, есть большое количество ресурсов, чтобы помочь вам в этом. В Python, Natural Language Toolkit предоставляет классификаторы, которые часто используются для этого типа работы, например this demo .

Недостатком этого подхода является то, что он обычно ограничивается положительной / отрицательной классификацией и очень специфичен для конкретной области. Например, классификатор, обученный распознавать положительные рецензии на фильмы, будет плохо выполнять классификацию рецензий на программное обеспечение.

Также была проделана некоторая работа по классификации эмоций в тексте, например, эта бумага , а также эта по идентификации эмоционального содержания постов в блоге К сожалению, похоже, в этом вам вряд ли удастся найти как можно больше «готовых» библиотечных средств поддержки для этой задачи, но, учитывая информацию, полученную в исследовании, вы сможете построить систему такого типа на основе чего-то вроде NLTK или другие библиотеки классификации / обработки естественного языка.

0 голосов
/ 27 октября 2011

Система «Шаблон» используется для анализа настроений:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...