Почему в нижнем колонтитуле файла ORC хранится заголовок файла SIZE? - PullRequest
0 голосов
/ 12 марта 2019

Взято из: https://orc.apache.org/specification/ORCv2/

Код нижнего колонтитула файла ORC:

message Footer {
 // the length of the file header in bytes (always 3)
 optional uint64 headerLength = 1;
 // the length of the file header and body in bytes
 optional uint64 contentLength = 2;
 // the information about the stripes
 repeated StripeInformation stripes = 3;
 // the schema information
 repeated Type types = 4;
 // the user metadata that was added
 repeated UserMetadataItem metadata = 5;
 // the total number of rows in the file
 optional uint64 numberOfRows = 6;
 // the statistics of each column across the file
 repeated ColumnStatistics statistics = 7;
 // the maximum number of rows in each index entry
 optional uint32 rowIndexStride = 8;
}

Я понимаю, что заголовок файла ORC всегда начинается с сигнатуры файла, а именно с 3 байтовстрока: "ORC", чтобы любой читатель файла знал свой файл ORC.Так какой смысл в нижнем колонтитуле ORC-файла содержать длину сигнатуры файла, которая всегда будет 3 байта?

...