Советы по использованию настраиваемой лексики и базы данных Synset для анализа настроений: RuSentiLex и RuWordNet - PullRequest
0 голосов
/ 30 апреля 2019

Я пытаюсь провести лексиконный анализ настроений на русском языке.

Я нашел лексикон настроений русского языка RuSentiLex и базу данных синтаксиса RuWordNet . Однако мне не хватает опыта, чтобы использовать их вместе.

Чтобы уточнить, у меня есть знания в области кодирования для предварительной обработки текста и проведения базового анализа настроений с использованием словаря RuSentiLex.

Однако я хотел бы включить RuWordNet. Я не уверен, как это сделать, потому что я не совсем понимаю теги POS, для чего я считаю RuWordNet (как и эквивалентный английский язык WordNet ).

Итак, по сути, у меня есть два вопроса:

(1) У вас есть какой-нибудь совет или руководство по совместному использованию RuSentilex и RuWordNet?

(2) Если RuWordNet является базой данных для тегов POS (например, WordNet), есть ли какие-либо советы, руководства или инструкции по использованию / кодированию пользовательских тегов POS, таких как RuWordNet?

Я провел некоторые поиски по этому вопросу, но нашел разбросанные указания. Например, я нашел обсуждение создания пользовательского NLTK корпуса и нашел страницу GitHub для «создания и управления базой данных тезаурусов RuWordNet».

Но даже если я сгенерирую базу данных, я не уверен, как бы я использовал ее для маркировки POS.

Я чувствую, что передо мной все части, но мне не хватает знаний, чтобы собрать все вместе.

Большое спасибо за любую помощь или руководство.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...