Скажем, я создаю класс UDF с именем StaticLookupUDF, который должен загружать некоторые статические данные из локального файла во время построения.
В этом случае я хочу убедиться, что я не копирую работу больше, чем янеобходимо, потому что я не хочу перезагружать статические данные при каждом вызове методаvalu ().
Ясно, что каждый маппер использует свою собственную реализацию UDF, но создает новый экземплярполучить для каждой обработанной записи?
Например, , картограф собирается обработать 3 строки.Создает ли он один StaticLookupUDF и трижды вызывает метод define (), или он создает новый StaticLookupUDF для каждой записи, а также вызывает метод оценки только один раз для каждого экземпляра?
Если второй пример верен, каким альтернативным способомя должен структурировать это?
Не могу найти это где-нибудь в документах, я собираюсь просмотреть код, но решил, что я попрошу умных людей здесь одновременно.