Автоматически генерировать документацию данных в кластере Redshift - PullRequest
0 голосов
/ 29 апреля 2020

Я пытаюсь автоматически сгенерировать документацию данных в кластере Redshift для всех поддерживаемых продуктов данных, но у меня возникают проблемы с этим.

Есть ли способ получить / сохранить метаданные о таблицах / непосредственно в столбцах красного смещения?

Существует ли какой-нибудь автоматический c способ определения уникальных ключей в таблице Redshift?

Например, идеальным решением было бы иметь:

  • Расположение таблицы (кластер, схема и т. Д. c.)
  • Описание таблицы (что такое таблица для)
  • Описание каждого столбца (для чего предназначен каждый столбец, тип данных, является ли он ключевым столбцом, если да, то какого типа, и т. д. c.)
  • Распределение столбца (мин, max, median, mode и т. д. c.)
  • Столбцы, которые вместе образуют уникальную запись в таблице

Я полностью понимаю, что получение описаний автоматически практически невозможно, но я не смог найти способ хранить описания непосредственно в красном смещении, вместо этого мне пришлось бы использовать сторонние решения или вообще документацию вне сценариев SQL, которые я не большой поклонник, из-за как продукты данных построены прямо сейчас. Таким образом, было бы очень полезно иметь возможность хранить описание каждой таблицы / столбца в красном смещении.

1 Ответ

2 голосов
/ 30 апреля 2020

Amazon Redshift имеет возможность хранить COMMENT на:

  • ТАБЛИЦА
  • КОЛОНКА
  • КОНСТРАИНТ
  • БАЗА ДАННЫХ
  • VIEW

Вы можете использовать эти комментарии для хранения описаний. Для доступа к нему может потребоваться объединение таблиц.

См .: КОММЕНТАРИЙ - Amazon Redshift

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...