Внедрение SCD type2 в Data Fusion - PullRequest
       44

Внедрение SCD type2 в Data Fusion

0 голосов
/ 17 февраля 2020

Я пытаюсь реализовать type2 в Datafusion. Может ли кто-нибудь помочь в выполнении вставки и обновления, используя преобразования конвейера / действие / условия для достижения этой цели. Я пытался создать ха sh, используя Wrangler для источника и цели, и присоединиться к ним. Я был поражен здесь, не уверенный, как определить, что идет, чтобы обновить / вставить и как обработать те. Моя цель - таблицы BigQuery.

1 Ответ

0 голосов
/ 17 февраля 2020

Добро пожаловать на переполнение стека @Manasa!

Как только вы рассматриваете Bigquery в качестве склада для целевой раковины, используя SCD type2 Метод слияния, вы могли бы сначала получить практический способ, как реализовать его, составляя конкретный оператор SQL, достигая желаемого логика c. Сказав это, я призываю вас изучить эту замечательную статью, написанную @ Hariharan Ramachandran , объясняющую методы SCD с некоторыми примерами использования сервиса Bigquery в качестве держателя данных назначения.

Согласно документации Data Fusion , вы можете найти богатый набор плагинов , расширяющих стандартные рабочие процессы обработки данных. Поэтому в данном конкретном случае я бы порекомендовал реализовать BigQuery Execute плагин, который можно настроить в вашем конвейере, выполняя SQL запросов к управляемой службе Bigquery и выполняя некоторые SCD2 указанные c действия.

enter image description here

...