Я хочу прочитать один файл (это HTML-документ) с моего компьютера и сохранить его в корпусе (я использую пакет tm
).
У вас есть какое-нибудь решение для этого?
Вот что я попробовал:
data<-read.csv(fileName)
c2<-Corpus(VectorSource(data))
это в основном работает, но иногда я получаю сообщение об ошибке: больше столбцов, чем имен столбцов
Полагаю, я не должен использовать read.csv
для веб-страницы, так как я не нашел лучшего решения.
Спасибо за вашу помощь =)