У меня есть папка с файлами .doc, и я хочу объединить их все в R, чтобы создать фрейм данных с filename
в качестве одного столбца и content
в качестве другого столбца (который будет включать в себя весь контент из. файл документа.
Это вообще возможно? Если да, не могли бы вы дать мне обзор того, как это сделать?
Я попытался начать с преобразования всех файлов в формат .txt, используя readtext()
, используя следующий код:
DATA_DIR <- system.file("C:/Users/MyFiles/Desktop")
readtext(paste0(DATA_DIR, "/files/*.doc"))
Я тоже пробовал:
setwd("C:/Users/My Files/Desktop")
Я не мог заставить либо работать (вывод от R был Error in list_files(file, ignore_missing, TRUE, verbosity) : File '' does not exist.
), но я не уверен, нужно ли это для того, что я хочу сделать.
Извините, что это довольно расплывчато; Я думаю, я хочу знать в первую очередь, можно ли сделать то, что я хочу сделать. Большое спасибо!