НЛП классифицирует предложения / абзацы как смешные - PullRequest
7 голосов
/ 14 февраля 2009

Есть ли способ классифицировать конкретное предложение / абзац как забавный. Существует очень мало указателей на то, куда следует идти дальше.

Ответы [ 5 ]

8 голосов
/ 14 февраля 2009

Существует исследование, которое называется Вычислительный юмор . Это междисциплинарная область, в которой используются элементы компьютерной лингвистики, психолингвистики, искусственного интеллекта, машинного обучения и т. Д. Они пытаются выяснить, что же делает истории или шутки смешными (например, неожиданная связь или использование темы табу неожиданным образом и т. д.) и примените его к тексту (либо для создания забавного рассказа, либо для измерения «забавности» текста).

Есть книг и статей об этом (например, Грэм Ричи ).

5 голосов
/ 14 февраля 2009

Да, вы должны использовать Учебную Корпорацию, чтобы построить прогностическую модель, способную обнаруживать забавные предложения. Иногда это известно как «Анализ настроения» в литературе. Взгляните на эту статью о анализе настроений с помощью LingPipe .

Если вы можете использовать Java, вы можете использовать их библиотеку (см. матрица лицензий ). Я нашел это очень полезным, не совсем в том же контексте, что и вы.

0 голосов
/ 22 февраля 2009

Кроме того, попробуйте Вычислительный юмор @ Google Scholar , если вы серьезно настроены попасть в поле. Анализ настроений также упоминался, см. wikipedia .

Конечно, все зависит от ваших целей и задач ...

0 голосов
/ 14 февраля 2009

Вы можете использовать ту же технику, что и спам-фильтры. Вместо спама / не спама вы классифицируетесь как смешные / не смешные. Посмотрите на наивные байесовские классификаторы для получения дополнительной информации.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

0 голосов
/ 14 февраля 2009

Единственный способ справиться с этим - заставить пару тысяч человек (обезьяны не пойдут, извините) просмотреть тысячи забавных предложений / историй, оценить их, а затем создать некую экспертную систему / нейронную. сеть из этого. Учитывая масштаб проблемы и ее субъективность (что-то смешное для одного человека может быть не смешным - даже оскорбительным - для другого), я бы сказал, что это невыполнимая задача.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...