Question

Sqoop импорт широких таблиц из oracle занимает много времени

Таблица содержит более 300 столбцов и около 70 миллионов строк.Варианты настройки производительности:

num mappers 15
fetch size 100000

Antonio Cachuan · Answer 1 · 03 января 2019

Работа с большими таблицами, как вы описали, означает изменение некоторых дополнительных параметров, таких как map, и уменьшение памяти и кучи Java Max.Я поделился некоторыми конфигурациями для таблиц, не слишком больших, но это оптимизирует время обработки.

import -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.heap.memory-mb.ratio=0.8 -Dmapreduce.map.java.opts.max.heap=3355443200 -Dmapreduce.map.java.opts=-Xmx3g

PD: я использую Sqoop 1, а также рекомендую проверить Sqoop Documentation , чтобы узнать большеподробности об этих параметрах.

Sqoop импорт широкого стола

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Sqoop импорт широкого стола

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы