Я начинаю заниматься анализом текста в R, и у меня есть некоторые проблемы. У меня есть csv с комментариями пользователей о странице. Каждая строка - это отдельный комментарий. Он имеет только 1 столбец, тот, который имеет комментарии. Я пытался использовать Tidy в R, поэтому я импортирую файл (read.csv) и получаю фрейм данных с n факторными уровнями. Следующим шагом является попытка токенизации строк
CSV выглядит следующим образом
#load the data
prueba <- read.csv(file="C:/Users/Mr & Mrs Bean/Downloads/Prueba.csv", sep=";")
#trying to tokenize
ty_prueba <- tidy(prueba)
Error in UseMethod("tidy") :
no applicable method for 'tidy' applied to an object of class "factor"
Как видите, я получите эту ошибку. Я также пытаюсь преобразовать в символ этот столбец, но я получаю ту же ошибку. У каждого примера, который я смотрю, есть текст, подготовленный к работе, поэтому трудно увидеть, как готовятся необработанные тексты. Это проблема ладьи ie, поэтому любые советы будут оценены.