Как определить, являются ли файлы PDF или нет в R? - PullRequest
0 голосов
/ 17 апреля 2020

У меня есть набор данных из 150 000 файлов, у каждого из которых есть идентификатор, но нет пути к файлу. Они выглядят так:

files <– list.files()
head(files)
[1] "RePEc/bis/bisqtr/0002e" 
[2] "RePEc/bis/bisqtr/0004e" 
[3] "RePEc/fip/fedclv/01d"

Проблема в том, что некоторые из них html, некоторые текстовые файлы, а некоторые PDF-файлы, но у меня нет способа узнать, какой из них, без открытия каждого файла. Я только хочу сохранить PDF-файлы, поэтому есть ли способ заставить R проверять типы файлов?

Спасибо за любую помощь, которую вы можете оказать!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...