Могу ли я создать хэш-код без нулей и буквы «О»? - PullRequest
0 голосов
/ 13 июля 2020

Я использую функции pyspark sha1 () для генерации хэш-кода, есть ли способ избежать нулей и алфавита «O» в хэш-коде? Я использую хэш-код для создания уникального 6-символьного ключа для своих данных. Мне нужно, чтобы он был ha sh, так как при изменении данных мне нужен новый хэш-код и новый 6-символьный ключ. единственная проблема заключается в том, что когда я подставляю 6 символов из ha sh, начальный ноль опускается при экспорте данных в CSV. Любая помощь будет оценена

Ответы [ 2 ]

0 голосов
/ 15 июля 2020

Добавление к JoelFan's -

Используйте regex_replace, как показано ниже

from pyspark.sql.functions import *
newDf = df.withColumn('new_column_name', regexp_replace('column_name', 'character_to_replace', 'with_this'))
0 голосов
/ 13 июля 2020

Просто вызовите sha1 (), затем замените каждый ноль на G, а каждый Oh на H

...