Объединить и хэшировать все поля в потоке - PullRequest
0 голосов
/ 26 сентября 2019

Я пытаюсь создать поток, который добавляет два столбца к существующим столбцам.Первый - это хэш MD5 от ключевых полей, второй - хеш MD5 от всех остальных.Количество полей (как ключевых, так и всех остальных) может варьироваться.Я думаю, что могу передать список ключей и полей данных через параметры потока, например, KeyFields будет хранить метаданные столбцов ключей и метаданные DataFields всех других столбцов.Я пытаюсь найти функцию для действия DerivedColumn, что-то вроде этого (в псевдокоде):

md5(foreach(key:$KeyFields) { concat(concatKeys,key) })

Может быть, есть другой способ сделать это?Мой поток

Хранилище BLOB-объектов Azure (CSV) -> DerivedColumn -> Хранилище BLOB-объектов Azure (CSV)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...