Как создается словарь при составлении словарных классификаций?Как определяются значения? - PullRequest
0 голосов
/ 12 декабря 2018

Я пытаюсь создать сентиментальный анализ около 1 миллиона твитов, которые я собрал в Твиттере.Я нашел много словарей, связанных с категоризацией текста.Словари, которые я нашел, были оцененными словами между -4 и +4.Например,

веер 3

злой -2

месть -2

плохо -3

спокойствие 2

празднование 3

Что мне интересно, так это то, как числа даются словам.Как я могу быть уверен, что числа верны?Как создаются словари?

1 Ответ

0 голосов
/ 12 декабря 2018

Представленный вами пример, по-видимому, (субъективно) оценивает слова на основе их «положительного / отрицательного» значения.Итак, следующий твит: «Это был плохой праздник; я злой фанат».получил бы +1, тогда как "Я фанат этого праздника!"набрал бы + 6.

Окончательная сумма для любого твита может затем использоваться в стратегии, чтобы сделать что-то .Вы можете послать пакеты с конфетами любому, кто пишет в Твиттере -10 или ниже в надежде подбодрить ихВы можете сохранить твит со счетом +50 или выше, чтобы он показывался большему количеству людей.

Это все аналитическая игра, и нет «правильных ответов», когда речь идет о присвоении субъективных чисел словам, покавы указываете конкретное намерение того, что вы хотите сделать с результирующими данными.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...