Оценка списков слов для анализа настроений - PullRequest
0 голосов
/ 19 апреля 2020

Я думаю о способах оценки параметров чувств в списках слов, таких как LIW C и ANEW (например, negemo / posemo в случае LIW C) для анализа настроений. Эти списки слов присваивают слова оцененные человеком значения и позволяют оценивать валентность текста на основе встречаемости слов. Теперь, если у меня длинный текстовый корпус, в котором каждое отдельное предложение оценивается на валентность, могу ли я использовать случайный лес для прогнозирования оценок предложений, используя значения валентности в списке слов, задаваемые предложениям в качестве входных переменных, а затем, наконец, используйте основанную на перестановке важность функции, такую ​​как SHAP, чтобы получить наиболее важную функцию, поскольку эти методы должны быть точными в соответствии с Lundegren et al. (2017: https://papers.nips.cc/paper/7062-a-unified-approach-to-interpreting-model-predictions.pdf)? Гомес-Рамирес и соавт. (2019: https://www.biorxiv.org/content/10.1101/785519v1.full.pdf) используют аналогичную технику для поиска важных функций в прогнозировании снижения когнитивных способностей, и теперь мне интересно, можно ли провести аналог в случае списков слов. Спасибо за ваши мысли и извините, если я делаю неправильные выводы, так как мои знания по МЛ все еще зачаточны.


Редактировать: также, если это может быть неправильное место для этого вопроса, пожалуйста, перенаправьте меня .

...