Добавление столбцов данных в AWS Glue - PullRequest
0 голосов
/ 28 января 2019

Мне не удалось найти подходящее подсообщество, поэтому я надеюсь, что мой вопрос здесь подходит.

В настоящее время я работаю над настройкой ETL-конвейера для аналитического решения в AWS с использованием S3, Lambda, Redshiftи клей.Делая это, я наткнулся на случай использования, который, как мне показалось, был обычным, но я почти ничего не нашел об этом в Google.

Моя проблема в том, что я получаю данные из стороннего источника для парымесяцев, прежде чем обнаружить, что мне не хватает пары столбцов, которые было бы хорошо иметь.Во время начальной настройки не было большой проблемы просто сбросить все и перезагрузить все с новой таблицей данных (как в клее, так и в красном смещении), но это стоило бы значительных денег на этом этапе.

Что может быть хорошим способом добавления столбца данных в существующую таблицу данных в каталоге данных Glue без создания совершенно новой таблицы?Я мог бы справиться только с пустыми (или NULL) значениями для уже существующих строк.

Большое спасибо!

1 Ответ

0 голосов
/ 29 января 2019

Вы можете добавить столбец к существующей таблице в каталоге данных Glue, используя любую из двух следующих опций

  1. Первый вариант - вручную изменить консоль клея, перейдя в Базы данных -> Таблицы-> Нажмите таблицу -> Изменить схему -> Добавить столбец.Вы сможете увидеть его в своей таблице после его обновления.

  2. Если вы не хотите делать это вручную, вы можете использовать Glue API call выбрав свой язык программирования.Например, python для вызова API Boto3 .

...