Я пытаюсь задуматься над некоторыми из этих проектов / пакетов служб SSIS, знакомясь с ETL в Pentaho Data Integration.
Я запускаю несколько пользовательских журналов (для повторного использования).
Другим распространенным «компонентом» в сценариях ETL является старый «найти диапазон данных для извлечения».
Полагаю, некоторые люди просто говорят: «Возьми X месяцев назад и работай над этим» - это быстро, но, возможно, несколько лениво. Я предпочитаю некоторые распространенные инкрементные шаблоны, такие как «запрос последней введенной даты, извлечение оттуда».
В любом случае, поэтому в этих сценариях ETL я создаю модульные «дочерние пакеты» для повторного использования. Будь то ведение журнала, поиск диапазона дат, сценарии расчета и т. Д. Для использования в 20-30 пакетах.
Мне просто интересно --- эти дочерние пакеты - если я повторно использую "искатель диапазона дат" и передаю его переменным "start_range" и "end_range" в дочернем пакете, эти пакеты - может вызываться разными родителями несколько раз - он может передавать свои уникальные результаты каждому родителю, который его вызвал, верно? Надеюсь, что это имеет смысл - я полагаю, что я могу проверить это здесь. Я обеспокоен, если в конце концов это скажут два родителя одновременно - я думаю, что произойдут два отдельных / независимых казни, но кто знает.