Cloud Dataprep - заменить код или идентификатор на значение со средним набором данных - PullRequest
1 голос
/ 11 апреля 2019

Я действительно новичок в Gap dataprep и сейчас пытаюсь создать рецепт, но я не могу понять, как это сделать.

В итоге у меня есть 2 файла, первый с этими столбцами: NAME, CONTRY_CODE, ...

И второй с: COUNTRY_CODE, COUNTRY_NAME

Как заменить COUNTRY_CODE из первого набора данных на COUNTRY_NAME второго (соответствует соответствующему COUNTRY_CODE )?.

Заранее спасибо!

Ответы [ 2 ]

0 голосов
/ 12 апреля 2019

Хотя ответ «Поиск» будет работать правильно, параметр «1001» может быть лучшим решением для расширяемости, поскольку он поддерживает несколько столбцов на удаленной стороне, показывает скорость совпадения, допускает нечеткое сопоставление и множество других полезностей ( как игнорирование пробелов в матчах). Вы также можете выбрать тип соединения для управления обработкой выходных и пропущенных строк.

Семантически эти два варианта не сильно отличаются, и я не видел реальной разницы в производительности, но я смог упростить некоторые из этих операций с помощью такого соединения:

Google Cloud DataPrep step menu showing a simple Join operation

0 голосов
/ 11 апреля 2019

Для тех, кто пытается сделать этот тип вещей.Вы можете добиться этого с помощью свойства Lookup в Dataprep!.

Просто выберите столбец, который хотите изменить (в моем случае COUNTRY_CODE ), затем выберите Lookup -> Выберите набор данных (в моем случае второй).И он заменит его, как и ожидалось!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...