Импортировать информацию из файлов .doc в R - PullRequest
0 голосов
/ 05 ноября 2018

У меня есть папка с файлами .doc, и я хочу объединить их все в R, чтобы создать фрейм данных с filename в качестве одного столбца и content в качестве другого столбца (который будет включать в себя весь контент из. файл документа.

Это вообще возможно? Если да, не могли бы вы дать мне обзор того, как это сделать?

Я попытался начать с преобразования всех файлов в формат .txt, используя readtext(), используя следующий код:

 DATA_DIR <- system.file("C:/Users/MyFiles/Desktop")
 readtext(paste0(DATA_DIR, "/files/*.doc"))

Я тоже пробовал:

 setwd("C:/Users/My Files/Desktop")

Я не мог заставить либо работать (вывод от R был Error in list_files(file, ignore_missing, TRUE, verbosity) : File '' does not exist.), но я не уверен, нужно ли это для того, что я хочу сделать.

Извините, что это довольно расплывчато; Я думаю, я хочу знать в первую очередь, можно ли сделать то, что я хочу сделать. Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...