я пытаюсь запустить unnest_tokens()
в столбце essay4
этого набора данных:
https://github.com/rudeboybert/JSE_OkCupid/blob/master/profiles.csv.zip
я пробовал и unnest_tokens()
, и unnest_tokens_()
, а также запуск dput(as_tibble())
на profiles.csv, чтобы попытаться заставить программу работать из-за ответа, который я видел на похожий вопрос, который работал для кого-то другого, но я всегда получаю одну из двух ошибок.
когда я запускаю это:
tidy_essays <- dput_tbl_profiles %>%
unnest_tokens(word, dput_tbl_profiles$essay4)
я получаю эту ошибку:
Error in check_input(x) :
Input must be a character vector of any length or a list of character
vectors, each of which has a length of 1.
когда я запускаю это:
tidy_essays <- dput_tbl_profiles %>%
unnest_tokens_(word, dput_tbl_profiles$essay4)
я получаю эту ошибку:
Error: Can't convert a closure to a quosure
Я также пытался выполнить те же операции на версии profiles.csv, на которой не было запущено dput(as_tibble())
.
Я не могу понять, что делать делай здесь кажется, что у других людей возникли проблемы с этой функцией, потому что они не передают ей символьные векторы (например, вместо отправки списка), или они забывают установить stringsAsFactors = FALSE
при чтении данных, что я и сделал сделать.
любой совет, как поступить? i wi sh Я мог бы связать данные напрямую, вместо того, чтобы связывать zip-файл, но размер файла составляет 1/3 от размера, когда он заархивирован. о, и это не моя учетная запись на github, так что я не могу решить, как будут храниться данные.
в любом случае, заранее благодарю за понимание.