Обращая внимание на возможности, некоторые пользователи говорят, что единственным преимуществом Bulk Loader является производительность с очень большой партией строк (свыше миллионов). Но есть способы противостоять этому.
Попробуйте использовать шаг для вывода таблицы , с размером пакета («Размер коммита» в шаге) 5000 и изменением количества копий, выполняющих этот шаг (зависит от количества ядер в вашем процессоре). ) 4 экземпляра (двухъядерный процессор с 2 логическими ядрами и т. д.). Вы можете изменить количество копий, щелкнув правой кнопкой мыши шаг в графическом интерфейсе и установив желаемое количество.
Это распараллелит вывод в 4 группы вставок по 5000 строк в каждом цикле. Если это вызывает перегрузку памяти в JVM, вы можете легко адаптировать ее и увеличить использование памяти в параметре PENTAHO_DI_JAVA_OPTIONS, просто удвоив количество, установленное для Xms (минимум) и XmX (максимум), для моего установлено значение «-Xms2048m» -Xmx4096m».
Единственная особенность, которую я обнаружил на этом шаге и в PostgreSQL, заключается в том, что вам нужно указать поля базы данных на этом шаге, даже если входящие строки имеют точно такую же структуру, что и таблица.