Выбор лучших типов данных и длины для представления данных - PullRequest
0 голосов
/ 27 мая 2011

Я нахожусь в процессе разработки витрины данных для одного из моих клиентов.

Я хотел бы знать, есть ли лучшая практика в определении и выборе типов данных и длин для столбцов в витрине данных. Я немного обеспокоен этим, поскольку данные будут поступать из нескольких источников, а максимальная длина (в соответствии с профайлером данных sql) не является максимальной в другом.

Заранее спасибо.

1 Ответ

1 голос
/ 31 мая 2011

Несколько вещей, которые я бы предложил @picmate ... (Мы используем MS SQL Server (поэтому мои примеры типов данных будут здесь))

  • используйте целочисленные суррогатные ключи (small /small int, если вы знаете количество значений в вашем измерении).
  • подразумевается, что не используйте естественные ключи для объединения димов / фактов.
  • очевидно, вам нужно будет выбрать самые длинные / самые большие значения, для которых вы строите схему.
  • Не создавайте для точного допуска полей, которые вы ожидаете.Например, если компания сообщает, что код продукта - это CHAR (10), и он никогда не изменится, убедитесь, что вы добавили несколько дополнительных символов, поскольку всегда будут исключения, которые не рассматривались (например, слияние компаний!).Поэтому выберите VARCHAR (255) вместо CHAR (10).Издержки только на +2 байта превышают длину переменной
  • . Используйте любые собственные типы данных, которые дают вам преимущество в хранении (SMALLDATETIME, TIME)
...