Я использую AWS Glue и мне нужно преобразовать логические (True и False) столбцы в схеме хранилища данных Redshift в «Да» / «Нет» в другой схеме Redshift.В настоящее время в графическом интерфейсе AWS Glue нет простого способа сделать это.
Я следовал приведенному здесь руководству следующим образом: https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-crawler-pyspark-transforms-map.html
и создал функцию:
def ConvertBoolean(dataFrame,ColumnName):
dataFrame["booleanTransform"] = {}
if dataFrame[ColumnName] == True:
dataFrame["booleanTransform"] = "Yes"
else:
dataFrame["booleanTransform"] = "No"
del dataFrame[ColumnName]
dataFrame[ColumnName] = {}
dataFrame[ColumnName] = dataFrame["booleanTransform"]
del dataFrame["booleanTransform"]
return dataFrame
Но не знаю, где должна храниться функция или как передать динамический кадр, как это не указано в приведенном примере документации.
Как лучше всего это сделать вкод pyspark AWS Glue?