После того, как я столкнулся с подобной проблемой, вот что я нашел.
Полный код с сайта:
library(janeaustenr)
library(dplyr)
library(stringr)
tidy_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text,
regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup() %>%
unnest_tokens(word, text)
nrc_joy <- get_sentiments("nrc") %>%
filter(sentiment == "joy")
Набор данных 'abc' не указан в вопросе;тем не менее, легко составить замещающий набор данных с использованием «differentColumnNameForWord».
library(tidytext)
abc <- data.frame(differentColumnNameForWord = stop_words$word, stringsAsFactors = FALSE)
Чтобы найти имя столбца, слова которого хранятся во фрейме данных, можно использовать функцию «имена».
> names(abc)
[1] "DifferentColumnNameForWord"
Как только имя столбца будет идентифицировано, код необходимо будет изменить следующим образом:
abc %>% inner_join(nrc_joy, by = c("DifferentColumnNameForWord" = "word")) %>%
count(DifferentColumnNameForWord, sort = TRUE)
В моей ситуации в одном наборе данных были слова под словом "word"столбец, в то время как другой имел слова под столбцом «термин».