Мне не удалось найти подходящее подсообщество, поэтому я надеюсь, что мой вопрос здесь подходит.
В настоящее время я работаю над настройкой ETL-конвейера для аналитического решения в AWS с использованием S3, Lambda, Redshiftи клей.Делая это, я наткнулся на случай использования, который, как мне показалось, был обычным, но я почти ничего не нашел об этом в Google.
Моя проблема в том, что я получаю данные из стороннего источника для парымесяцев, прежде чем обнаружить, что мне не хватает пары столбцов, которые было бы хорошо иметь.Во время начальной настройки не было большой проблемы просто сбросить все и перезагрузить все с новой таблицей данных (как в клее, так и в красном смещении), но это стоило бы значительных денег на этом этапе.
Что может быть хорошим способом добавления столбца данных в существующую таблицу данных в каталоге данных Glue без создания совершенно новой таблицы?Я мог бы справиться только с пустыми (или NULL) значениями для уже существующих строк.
Большое спасибо!