Apache spark - JDBC write, промежуточные коммиты - PullRequest
0 голосов
/ 12 сентября 2018

Я работаю над записью в Microsoft SQL Server с использованием Spark из куста, процесс работает с большой скоростью.

Но есть большая проблема, что каждая задача до завершения не фиксирует - которая использует журнал транзакцийбазы данных и может повлиять на другие выполняющиеся задания.

Мне нужно иметь какой-то способ коммитов через регулярные промежутки времени (10000 К или около того).Может кто-нибудь подсказать, как это можно сделать?

1 Ответ

0 голосов
/ 12 сентября 2018

Это невозможно с JDBC.

С экспортом sqoop есть возможность.

...