Применение функции unnest_tokens к твитам создает 1 столбец с каждым словом в отдельной строке. У меня есть дополнительные столбцы в исходном фрейме данных (день, час, мин) каждого твита. Есть ли способ, чтобы в каждой строке слов было еще три столбца дня, часа и минуты для каждого соответствующего слова? Я пробовал следующее:
tweet_words$text <- tweet_words %>%
select(text) %>%
unnest_tokens(word, text)
Исходный фрейм данных имеет текстовый столбец «tweet_words $ text», где каждая строка представляет собой 1 твит. Я попытался переписать текстовый столбец в столбец из отдельных слов, но получил следующую ошибку, потому что в столбцах день, час, минимум не одинаковое количество строк. Я получаю следующую ошибку.
Ошибка в $<-.data.frame
(*tmp*
, text, value = list (word = c («то же»,: замена имеет 4571 строку, данные - 300
Есть идеи, как облегчить желаемый результат?