Я пытаюсь реализовать функцию, которая загружает около 40 миллионов записей в базу данных MySQL, которая размещена на AWS. Тем не менее, мой оператор записи застревает на 94% на бесконечно долгое время.
Это команда, которую я использую для загрузки df_intermediate.write.mode("append").jdbc(jdbcUrl, "user", connectionProperties)
с включенными rewriteBatchedStatements
и useServerPrepStmts
в свойствах соединения.
Этот оператор работает для небольшого количества баллов (50000), но не может обработать эту большую сумму. Я также увеличил максимальное количество соединений на стороне MySQL.
РЕДАКТИРОВАТЬ: я запускаю это на машинах GCP n1-standard-16.
Почему могут быть причины, по которым запись зависает на 94%?