У меня есть набор данных из 150 000 файлов, у каждого из которых есть идентификатор, но нет пути к файлу. Они выглядят так:
files <– list.files()
head(files)
[1] "RePEc/bis/bisqtr/0002e"
[2] "RePEc/bis/bisqtr/0004e"
[3] "RePEc/fip/fedclv/01d"
Проблема в том, что некоторые из них html, некоторые текстовые файлы, а некоторые PDF-файлы, но у меня нет способа узнать, какой из них, без открытия каждого файла. Я только хочу сохранить PDF-файлы, поэтому есть ли способ заставить R проверять типы файлов?
Спасибо за любую помощь, которую вы можете оказать!