Кто-нибудь знает способ добавить исходное имя файла в виде столбца в задании Glue?
Мы создали поток, в котором мы сканировали некоторые файлы в S3 для создания схемы.Затем мы написали задание, которое преобразует файлы в новый формат, и записывает эти файлы обратно в другое хранилище S3 как CSV, чтобы использовать его в остальной части нашего конвейера.Мы хотели бы получить доступ к некоторым мета-свойствам задания, чтобы мы могли добавить в выходной файл новый столбец, содержащий исходное имя файла.
Я просмотрел документацию AWS и источник aws-glue-libs, но не увидел ничего, что выскочило.В идеале был бы какой-то способ получить метаданные из пакета awsglue.job
(мы используем версию Python).
Я все еще изучаю Glue, поэтому извиняюсь, если использую неправильную терминологию.Я также пометил это тегом-искрой, потому что я считаю, что это то, что Клей использует под крышками.