Question

Я начинаю заниматься анализом текста в R, и у меня есть некоторые проблемы. У меня есть csv с комментариями пользователей о странице. Каждая строка - это отдельный комментарий. Он имеет только 1 столбец, тот, который имеет комментарии. Я пытался использовать Tidy в R, поэтому я импортирую файл (read.csv) и получаю фрейм данных с n факторными уровнями. Следующим шагом является попытка токенизации строк

CSV выглядит следующим образом

#load the data
prueba <- read.csv(file="C:/Users/Mr & Mrs Bean/Downloads/Prueba.csv", sep=";")
#trying to tokenize
ty_prueba <- tidy(prueba)
Error in UseMethod("tidy") : 
  no applicable method for 'tidy' applied to an object of class "factor"

Как видите, я получите эту ошибку. Я также пытаюсь преобразовать в символ этот столбец, но я получаю ту же ошибку. У каждого примера, который я смотрю, есть текст, подготовленный к работе, поэтому трудно увидеть, как готовятся необработанные тексты. Это проблема ладьи ie, поэтому любые советы будут оценены.

Pablo · Answer 1 · 22 марта 2020

Я нашел решение. Как кто-то публикует здесь , теперь я использовал read_excel (библиотека readxl) вместо read.csv. Меня устраивает. Я предполагаю, что это связано с тем, как R читает файл.

Нет применимого метода для 'tidy', примененного к объекту класса "factor 'в Tidytext

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет применимого метода для 'tidy', примененного к объекту класса "factor 'в Tidytext

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы