У меня есть фрейм данных со списком строк в одном столбце.Я пытаюсь использовать unnest_tokens
для этого столбца, чтобы иметь один токен на строку, но не могу сделать это, когда строки находятся в списке.
Фрейм данных выглядит следующим образом:
> dat
department instructor_gender comments
1 BME F is amazing and you will love her!, Prof. is so nice
Я пытался удалить, используя
dat.word <- dat %>%
unnest_tokens(word, unlist(comments))
, но получил:
Error in check_input(x) :
Input must be a character vector of any length or a list of character
vectors, each of which has a length of 1.
Как я могу удалить этот список строк, чтобы иметь одно слово в строке?
Редактировать:
> dput(dat)
structure(list(department = "BME", instructor_gender = "F", comments = list(
c("is amazing and you will love her!", "Prof. is so nice"
))), class = "data.frame", row.names = c(NA, -1L))
Редактировать 2: желаемый выход
> output
word department instructor_gender
1 is BME F
2 amazing BME F
3 and BME F
4 you BME F