Включить текстовые числовые значения во время анализа настроений - PullRequest
0 голосов
/ 29 января 2019

Я работаю над проблемой, подобной анализу настроений. Предположительно, текст содержит числа, которые будут иметь значение при категоризации, например:

I rate this product with 5 stars --> like
this product is 10x times worse --> hate
this product is 1x times worse --> don't like

Как эти числа можно интерпретировать, чтобы повлиять на результат, отмечая, что, текст бесплатный и не используется.

1 Ответ

0 голосов
/ 29 января 2019

Допустим, вы хотите закодировать предложения, используя подход «мешок слов».Затем кодирование каждого числа в отдельный индекс невозможно, поскольку существует бесконечно много чисел.То, что я хотел бы сделать, это иметь индексы n (n, вероятно, будут равны количеству классов в ваших датах), выделенные для чисел, где я бы закодировал все числа из набора данных.Тогда, где будет находиться каждое число, будет зависеть от порога.Вы можете вывести эти пороговые значения из данных обучения.Например, все числа больше 5 для определенного индекса, все числа больше 10 для другого и т. Д. И т. Д.

...