У меня есть таблица в улье с приведенной ниже схемой emp_id: int emp_name: string
Я создал фрейм данных из приведенной выше таблицы кустов
df = sql_context.sql('SELECT * FROM employee ORDER by emp_id')
df.show()
После запуска приведенного выше кода я вижу, чтоданные сортируются правильно в emp_id
Я пытаюсь записать данные в таблицу Oracle с помощью кода ниже
df.write.jdbc(url=url, table='target_table', properties=properties, mode="overwrite")
Насколько я понимаю, это происходит из-за нескольких процессов-исполнителей, работающих нав то же время для каждого раздела данных и сортировки, применяемой с помощью запроса, применялись к конкретному разделу, и когда несколько процессов, записывающих данные в Oracle одновременно, искажали порядок таблицы результатов
Затем я попытался перераспределить данные толькоодин раздел (что не является идеальным решением) и пост-запись данных в oracle, сортировка работала правильно
Есть ли способ записи отсортированных данных в RDBMS из SPARK