Использование сжатия BYTEDICT со столбцами VARCHAR в Redshift: кто-то может прояснить это утверждение из документации? - PullRequest
0 голосов
/ 19 июня 2019

Я читаю документацию AWS Redshift относительно типов сжатия .В разделе сжатие BYTEDICT говорится следующее:

Кодировка байтового словаря не всегда эффективна при использовании со столбцами VARCHAR.Использование BYTEDICT с большими столбцами VARCHAR может привести к чрезмерному использованию диска.Мы настоятельно рекомендуем использовать другую кодировку, такую ​​как LZO, для столбцов VARCHAR.

Предполагая, что "большие столбцы VARCHAR" означают "большую мощность", эта рекомендация имеет смысл.Однако в последнем предложении говорится, что не стоит беспокоиться об использовании BYTEDICT с VARCHAR на всех .Это не имеет смысла для меня, хотя. Если бы у вас были миллионы VARCHAR строк, но количество элементов было низким (например, в Канадских провинциях), разве BYTEDICT не был бы лучшим выбором?

1 Ответ

1 голос
/ 19 июня 2019

Важным словом здесь является «всегда», что означает, что иногда это так, а иногда - не лучший вариант.

«Кодировка байтового словаря не всегда эффективна при использовании сСтолбцы VARCHAR "

Bytedict отлично работает в заданном вами сценарии использования, вот для чего он предназначен!

Если это важно для вашего варианта использования, то вам следует попробоватьопций как для хранения, так и для производительности запросов.

...