Я работаю с не полностью документированной системой СУБД и ищу программный инструмент общего назначения, который изучит значения в столбцах и выдаст описание того, что там есть.
Полагаю, я ищу что-то среднее между DESCRIBE
, SELECT DISTINCT col
, SELECT MIN(COL), MAX(COL)
и другой сводной статистикой.
В идеале я бы хотел, чтобы он мог выполнять такие действия, как обнаружение текстового столбца и объявление таких вещей, как «Этот столбец - текст UTF-8, 5% NULL, 15% одно слово, 30% два слова, 35% три слова, а остальные что-то еще.
Или «Этот столбец является меткой даты. Значения лежат в диапазоне 2001-02-01: 2024-01-01. Без NULL»
Этот инструмент существует где-нибудь? Какие-либо предложения? Спасибо.