У меня есть искровые проза, который выполняет некоторые вычисления, затем выполняет вставку в таблицу MySQL, все вычисления выполняются за 40-50 минут, но.Запись в таблицу занимает 2-3 часа (зависит от использования БД).Я пытался сделать пакетный размер
val db_url_2 = "jdbc:mysql://name.amazonaws.com:port/db_name?rewriteBatchedStatements=true"
df_trsnss.write.format("jdbc").option("url", db_url_2).option("dbtable", output_table_name).option("user", db_user).option("password", db_pwd).option("truncate","true").option("batchsize", 5000).mode("overwrite").save()
, но загрузка все равно длилась вечно, я не могу позволить себе тратить 2-4 часа в день только на подсчет и запись данных в таблицу.
Есть ли способ ускорить этот процесс?
Начните думать, чтобы сделать запись в CSV, а затем загрузить его в дБ из CSVтак что я могу сократить время EMR.