R unnest_tokens элементы из списка - PullRequest
1 голос
/ 12 апреля 2020

У меня есть это:

library(tidytext)
list_chars <- list("you and I", "he or she", "we and they")
list_chars_as_tibble <- lapply(list_chars, tibble)
list_chars_by_word <- lapply(list_chars_as_tibble, unnest_tokens)

получил это:

Error in check_input(x) : 
  Input must be a character vector of any length or a list of character
  vectors, each of which has a length of 1.

хочу получить это:

[[1]]
1 you
2 and
3 I

[[2]]
1 he
2 or
3 she

[[3]]
1 we
2 and
3 they

пожалуйста, помогите, я считаю, что я пытался все, но, видимо, нет, спасибо

1 Ответ

0 голосов
/ 12 апреля 2020

unnest_tokens() нужно указать, какой столбец нужно проанализировать, поэтому вам нужно назвать столбец символов в ваших таблицах:

library(tidytext)
library(tibble)

list_chars_as_tibble <- lapply(list_chars, function(x) tibble(txt = x))
lapply(list_chars_as_tibble, unnest_tokens, word, txt)

[[1]]
# A tibble: 3 x 1
  word 
  <chr>
1 you  
2 and  
3 i    

[[2]]
# A tibble: 3 x 1
  word 
  <chr>
1 he   
2 or   
3 she  

[[3]]
# A tibble: 3 x 1
  word 
  <chr>
1 we   
2 and  
3 they 
...