Найдите неверный файл bz2 предпочтительнее, используя C / C ++ - PullRequest
0 голосов
/ 24 ноября 2018

У меня есть около 200 тысяч файлов bz2, в которых только один действительный.Размер каждого файла bz2 составляет менее 200 байт.Мне нужно найти правильный.Утилита командной строки bz2 отнимает слишком много времени.

Существует ли минимальная проверка с использованием файловых байтов, с помощью которой я могу найти недопустимый bz2 и игнорировать дальнейшую обработку.Я хочу сделать это на C / C ++, так как это будет намного быстрее, чем сценарии оболочки.

1 Ответ

0 голосов
/ 24 ноября 2018

Получил решение.Согласно формату bz2, первые 3 символа должны быть «BZh».Это отфильтровывало все файлы, кроме 19.

...