Какой метод наиболее подходит для определения различных настроений в одном и том же тексте с использованием Python? - PullRequest
0 голосов
/ 29 октября 2018

Я изучаю НЛП и в качестве примера я пытаюсь определить, какие чувства вызывают отзывы клиентов в онлайн-платформе курса.

Мне удалось определить чувства студентов только с помощью простого предложения, такого как «Курс очень хороший, я многому научился на нем», «Платформа обучения завершена, и мне действительно нравится ее использовать», « У меня могло бы быть больше курсов, связанных с морской биологией ", и так далее.

Я сомневаюсь, как правильно определить различные чувства в одном предложении или в нескольких предложениях. Например:

  1. Чувство в предложении:

    • «Курс очень хороший! Было бы здорово создать раздел вопросов на сайте».
  2. Более одного чувства в предложении:

    • «Курс очень хороший, но сайт нет.»
  3. Вовлечение обоих:

    • "Курс очень хороший, но платформа обучения очень медленная. В курсах может быть больше заданий и примеров, например, видео или микрофон на форуме".

Я думал о разбиении текста на предложения, но это не очень хорошо для примера 2.

Ответы [ 2 ]

0 голосов
/ 01 ноября 2018

Существует специальная библиотека для классификации по нескольким меткам:

scikit-multilearn

когда вы тренируете свою модель, вы должны разбивать классы на двоичные столбцы.

0 голосов
/ 30 октября 2018

Вы можете думать, что комы, другие знаки препинания и некоторые союзы и предлоги фактически разделяют предложения. Это фактически выходит за рамки кода в области лингвистики, поскольку они иногда, но не всегда, разделяют предложения.

Во втором случае у вас есть два предложения: «Курс очень хороший», но… «Сайт не [очень хороший]».

Я полагаю, что существуют пакеты NPL, которые могут разбивать предложения (возможно, зная, что большинство предложений следуют структуре субъекта / предиката / объекта, поэтому, если вы наберете более одного глагола, возможно, вы найдете одинаковое количество предложений) и вы могли бы использовать их для анализа вашего текста в первую очередь. Посмотрите, какие библиотеки делают это для вашего языка.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...