Я использую сжатие lz4 и записываю данные в таблицу кустов, эта таблица содержит 20 файлов, каждый из которых имеет размер 15 ГБ в HDFS, и каждое имя файла в этой таблице заканчивается lz4, например, part-m-00000.lz4
.
Когда я запускаю select count(1)
из этой таблицы, он запускает только 20 сопоставителей, что означает, что lz4 splittable
не вступает в силу.
Говорят, что lz4 поддерживает splittable для текстового файла, поэтому я быспросите, что я должен сделать или дополнительные шаги, чтобы включить это.