r: unnest_tokens () не работает с конкретным файлом - PullRequest
1 голос
/ 28 марта 2020

я пытаюсь запустить unnest_tokens() в столбце essay4 этого набора данных:

https://github.com/rudeboybert/JSE_OkCupid/blob/master/profiles.csv.zip

я пробовал и unnest_tokens(), и unnest_tokens_(), а также запуск dput(as_tibble()) на profiles.csv, чтобы попытаться заставить программу работать из-за ответа, который я видел на похожий вопрос, который работал для кого-то другого, но я всегда получаю одну из двух ошибок.

когда я запускаю это:

tidy_essays <- dput_tbl_profiles %>%
   unnest_tokens(word, dput_tbl_profiles$essay4)

я получаю эту ошибку:

Error in check_input(x) : 
  Input must be a character vector of any length or a list of character
  vectors, each of which has a length of 1.

когда я запускаю это:

tidy_essays <- dput_tbl_profiles %>%
   unnest_tokens_(word, dput_tbl_profiles$essay4)

я получаю эту ошибку:

Error: Can't convert a closure to a quosure

Я также пытался выполнить те же операции на версии profiles.csv, на которой не было запущено dput(as_tibble()).

Я не могу понять, что делать делай здесь кажется, что у других людей возникли проблемы с этой функцией, потому что они не передают ей символьные векторы (например, вместо отправки списка), или они забывают установить stringsAsFactors = FALSE при чтении данных, что я и сделал сделать.

любой совет, как поступить? i wi sh Я мог бы связать данные напрямую, вместо того, чтобы связывать zip-файл, но размер файла составляет 1/3 от размера, когда он заархивирован. о, и это не моя учетная запись на github, так что я не могу решить, как будут храниться данные.

в любом случае, заранее благодарю за понимание.

1 Ответ

2 голосов
/ 28 марта 2020

Нам нужно только указать имя столбца без кавычек

library(dplyr)
library(tidytext)
df1 <- read.csv("profiles.csv", stringsAsFactors = FALSE)
df1 %>%
     unnest_tokens(word, essay4)
# age      body_type              diet     drinks     drugs                         education
#1       22 a little extra strictly anything   socially     never     working on college/university
#1.1     22 a little extra strictly anything   socially     never     working on college/university
#1.2     22 a little extra strictly anything   socially     never     working on college/university
#1.3     22 a little extra strictly anything   socially     never     working on college/university
#1.4     22 a little extra strictly anything   socially     never     working on college/university
# ...
...