Вот базовый c пример настроения. Текстовые данные разбиваются на предложения с помощью функции get_sentences
. С помощью sentiment_by
мы приближаем чувство (полярность) текста для всего элемента списка (mytext
в этом примере).
Например, для примера:
library(sentimentr)
mytext <- c(
'do you like it? But I hate really bad dogs',
'I am the best friend.',
'Do you really like it? I\'m not a fan'
)
mytext <- get_sentences(mytext)
sentiment_by(mytext)
I получил следующий результат:
element_id word_count sd ave_sentiment
1: 1 10 1.497465 -0.8088680
2: 2 5 NA 0.5813777
3: 3 9 0.284605 0.2196345
Перед применением функции настроения я хотел бы удалить стоп-слова, числа, смайлики из mytext
. Я подумал, что мог бы использовать, например:
library("tm")
tm_map(mytext, removeNumbers)
tm_map(mytext, removeWords, stopwords())
, но я получил:
Error in UseMethod("tm_map", x) :
no applicable method for 'tm_map' applied to an object of class "c('get_sentences',
'get_sentences_character', 'list')"