Я пытаюсь провести лексиконный анализ настроений на русском языке.
Я нашел лексикон настроений русского языка RuSentiLex и базу данных синтаксиса RuWordNet .
Однако мне не хватает опыта, чтобы использовать их вместе.
Чтобы уточнить, у меня есть знания в области кодирования для предварительной обработки текста и проведения базового анализа настроений с использованием словаря RuSentiLex.
Однако я хотел бы включить RuWordNet. Я не уверен, как это сделать, потому что я не совсем понимаю теги POS, для чего я считаю RuWordNet (как и эквивалентный английский язык WordNet ).
Итак, по сути, у меня есть два вопроса:
(1) У вас есть какой-нибудь совет или руководство по совместному использованию RuSentilex и RuWordNet?
(2) Если RuWordNet является базой данных для тегов POS (например, WordNet), есть ли какие-либо советы, руководства или инструкции по использованию / кодированию пользовательских тегов POS, таких как RuWordNet?
Я провел некоторые поиски по этому вопросу, но нашел разбросанные указания. Например, я нашел обсуждение создания пользовательского NLTK корпуса и нашел страницу GitHub для «создания и управления базой данных тезаурусов RuWordNet».
Но даже если я сгенерирую базу данных, я не уверен, как бы я использовал ее для маркировки POS.
Я чувствую, что передо мной все части, но мне не хватает знаний, чтобы собрать все вместе.
Большое спасибо за любую помощь или руководство.