Порядка строк по умолчанию не существует, без ORDER BY
порядок не гарантируется.Этот факт не связан с используемой базой данных Metastore.
Обычно данные считываются параллельно многими процессами (мапперами), после вычисления разбиений каждый процесс начинает чтение некоторого фрагмента файла или нескольких файлов, в зависимости отРасчеты рассчитаны.Все параллельные процессы могут обрабатывать разные объемы данных и работать на разных узлах, нагрузка не всегда одинакова, поэтому они начинают возвращать строки и заканчивать в разное время, в зависимости от слишком многих факторов, таких как нагрузка на узел, нагрузка на сеть, объемданных на процесс и т. д. и т. д. Удалив все эти факторы, вы можете повысить точность прогнозирования заказа.Скажем, последовательное чтение из одного потока вернет строки в том же порядке, в каком они находятся в файле.Но это не то, как работает база данных.
Кроме того, согласно реляционной теории Кодда, порядок столбцов и строк не имеет значения для базы данных.