Задание mlcp предназначено для отправки всего входного файла в виде одного отдельного документа (документы -input_file_type) размером 500 МБ в модуль преобразования.Модуль преобразования имеет логику для разбивки значений и значений (content.uri и content.value) для каждого агрегатного элемента.Это приводит к ошибке пространства кучи Java, даже несмотря на то, что доступное пространство кучи на сервере составляет около 3,4 ГБ.
Я пробовал два разных работающих проекта.
- Добавить агрегацию в mlcp (-input_file_type aggregates, -aggregate_record_element CustId) для разбивки на несколько документов.Это создает несколько документов в промежуточной БД
- , сохраняя -input_file_type в качестве документов и удаляя -transform_module, чтобы файл загружался как один отдельный документ в промежуточную.
Оба подхода работают, ноПри втором подходе могут создаваться документы размером 500 МБ (я считаю, что ограничение размера составляет 512 МБ).Поэтому я решил использовать первый подход (также мне нужен лучший URI, чем по умолчанию, созданный mlcp).