Пакет `sentimentr`: как удалить смайлики и стоп-слова перед` sentiment_by` - PullRequest
0 голосов
/ 21 января 2020

Вот базовый c пример настроения. Текстовые данные разбиваются на предложения с помощью функции get_sentences. С помощью sentiment_by мы приближаем чувство (полярность) текста для всего элемента списка (mytext в этом примере).

Например, для примера:

library(sentimentr)

mytext <- c(
  'do you like it?  But I hate really bad dogs',
  'I am the best friend.',
  'Do you really like it?  I\'m not a fan'
)

mytext <- get_sentences(mytext)
sentiment_by(mytext)

I получил следующий результат:

   element_id word_count       sd ave_sentiment
1:          1         10 1.497465    -0.8088680
2:          2          5       NA     0.5813777
3:          3          9 0.284605     0.2196345

Перед применением функции настроения я хотел бы удалить стоп-слова, числа, смайлики из mytext. Я подумал, что мог бы использовать, например:

library("tm")
tm_map(mytext, removeNumbers)
tm_map(mytext, removeWords, stopwords())

, но я получил:

Error in UseMethod("tm_map", x) : 
 no applicable method for 'tm_map' applied to an object of class "c('get_sentences', 
'get_sentences_character', 'list')"
...