Question

У меня один CSV-источник с множеством повторяющихся строк. Я хочу выделить или удалить эти дубликаты. Кто-нибудь знает как?

Martin Esteban Zurita · Answer 1 · 06 ноября 2019

Это возможно с потоками данных!

Это очень хорошо объяснено здесь великим Кромером: https://kromerbigdata.com/2019/04/21/use-adf-mapping-data-flows-for-fuzzy-matching-and-dedupe/

Надеюсь, это помогло!

Mark Kromer · Answer 2 · 06 ноября 2019

Вы также найдете эти шаблоны в галерее шаблонов конвейера ADF. Просто зайдите в New Pipeline From Template в интерфейсе ADF в вашем браузере и найдите эти 2 шаблона потока данных:

Как проверить наличие дубликатов в одном источнике с помощью ADF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как проверить наличие дубликатов в одном источнике с помощью ADF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы