У меня есть некоторые проблемы при чтении паркетов из hdf, которые периодически создаются моими программами.Таким образом, он может произвести некоторые поврежденные файлы, если программа по какой-то причине выйдет из строя.
Теперь я хочу отличить поврежденные файлы от обычных и перейти в каталог резервного копирования.Но я не могу найти хороший способ сделать это.
Есть два вида поврежденных файлов, с которыми я встречался:
1.parquet is not a Parquet file (too small length: 4)
В этом случае это легко определить из-за егоразмер
2.parquet is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [56, 52, 53, 51]
В этом случае я понятия не имею, отличать это от обычных до чтения.
Я прочитал этот веб-сайт: https://datameer.zendesk.com/hc/en-us/articles/360006392072-Workbook-Fails-path-to-file-Is-Not-a-Parquet-File-Expected-Magic-Number-at-Tail
В соответствии с ним, "это будет меньше, чем у другого файла на месте.>, Но я пока не могу его найти.
Есть ли какое-нибудь хорошее решение, чтобы справиться с этим? Спасибо.