Анализ настроений на других языках - PullRequest
5 голосов
/ 13 октября 2011

Мой дипломный проект CSE Я выбрал симуляцию поисковой системы, которая использует анализ настроений, чтобы оценить, являются ли комментарии / обзоры положительными / отрицательными / нейтральными

Я не уверен, как бы я это сделал покаНо я понял, что он использует классифицирующие агенты, которые вы обучаете сначала, а затем он может классифицировать сам.преимущество невелико (около 60% я понимаю)

Мой вопрос: будет ли это работать на неанглийских языках?Я имею в виду, что я хочу провести анализ настроений на арабских комментариях / обзорах и сформировать правильное настроение, выполнимо ли это с текущими классификаторами?и если нет, то мне нужно написать свой собственный классификатор, возможно ли написать собственный классификатор?

Ответы [ 3 ]

8 голосов
/ 13 октября 2011

Мой вопрос, будет ли это работать на неанглийских языках?Я имею в виду, что я хочу провести анализ настроений на арабских комментариях / обзорах и сформировать правильное настроение, выполнимо ли это с текущими классификаторами?

Вы путаете некоторые вещи здесь.То, что вы называете «классифицирующим агентом», правильно называется учеником .Учащийся берет учебный комплект для создания классификатора .Это может быть применено к невидимым данным для получения положительных / отрицательных / нейтральных классификаций.

Чтобы адаптировать задачу NLP с машинным обучением, такую ​​как эта, к новому языку, вам необходим набор данных для обучения.Большинству инструментов для анализа настроений потребуется маркированный набор, который может быть дорогим, а в противном случае его будет сложно найти, поэтому я предлагаю вам воспользоваться неконтролируемым методом, описанным в этом ответе (без присмотра = учиться на немаркированных данных),Метод описан для английского языка, но я слышал, что на других языках были достигнуты разумные результаты.Однако YMMV основан на точном наборе данных, который вы собираетесь использовать.

0 голосов
/ 17 сентября 2012

Моя компания ( Repustate.com ) недавно добавила анализ настроений для арабского языка через наш API.Использование API не является бесплатным, но вы можете попробовать бесплатную онлайн-демонстрацию, чтобы увидеть, соответствует ли она вашим потребностям.Вот ссылка на бесплатную демоверсию .

0 голосов
/ 13 октября 2011

Есть идея сделать анализ настроений комментариев, основываясь на данных YouTube.

Обратите внимание, что на YouTube есть система «нравится / не нравится», поэтому вы, вероятно, можете использовать соотношение «нравится / не нравится» на видео, чтобы назначить положительное / отрицательное значение комментариям под ним.Кроме того, вы можете получить доступ к данным через API gdata.И этот метод не зависит от языка, вам просто нужно проанализировать видео, опубликованные на выбранном языке.

...