Sqoop импорт широкого стола - PullRequest
0 голосов
/ 23 декабря 2018

Sqoop импорт широких таблиц из oracle занимает много времени

Таблица содержит более 300 столбцов и около 70 миллионов строк.Варианты настройки производительности:

num mappers 15
fetch size 100000

1 Ответ

0 голосов
/ 03 января 2019

Работа с большими таблицами, как вы описали, означает изменение некоторых дополнительных параметров, таких как map, и уменьшение памяти и кучи Java Max.Я поделился некоторыми конфигурациями для таблиц, не слишком больших, но это оптимизирует время обработки.

import -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.heap.memory-mb.ratio=0.8 -Dmapreduce.map.java.opts.max.heap=3355443200 -Dmapreduce.map.java.opts=-Xmx3g

PD: я использую Sqoop 1, а также рекомендую проверить Sqoop Documentation , чтобы узнать большеподробности об этих параметрах.

...