У меня есть настройка потоковой передачи Hadoop, которая работает, однако при инициализации картографических устройств возникают некоторые накладные расходы, которые выполняются один раз для каждого файла, и, поскольку я обрабатываю много файлов, я замечаю, что трачу много времени на инициализацию.
Есть ли способ, без написания Java, указать, что я хочу повторно использовать один и тот же экземпляр сопоставления для нескольких файлов, чтобы амортизировать стоимость инициализации?