С друидом ожидается сжатие на 80-90 процентов. Я видел, что файл CSV размером 2 ГБ уменьшен до 200 МБ. Данные друида.
Можете ли вы запросить счетчик, чтобы убедиться, что все данные загружены? Все, пожалуйста, отключите приблизительный алгоритм hyper-log-log, чтобы получить точное количество. Друид SQL переключится на точное различное число, если вы установите для «useApproximateCountDistinct» значение «false», либо через контекст запроса, либо через конфигурацию брокера (см. * 1004). *)
Также можно проверить журналы на наличие исключений и сообщений об ошибках. Если возникает проблема с получением конкретной JSON-записи, она пропускает эту запись.