Какой метод сжатия базы данных без потерь является лучшим - PullRequest
1 голос
/ 10 июля 2011

У меня есть база данных с миллионами записей в ней.

таблица имеет два атрибута 1] Имя 2] Местоположение

Есть много записей, которые имеют разные имена, но с таким же местоположением, что исуществует ли какая-либо техника сжатия, которая может быть применена к атрибуту местоположения?

Вы можете предложить различные методы сжатия без потерь с их поддерживаемыми именами базы данных.

Ответы [ 2 ]

4 голосов
/ 10 июля 2011

Нормализуйте вашу базу данных . Имейте таблицу LOCATIONS и дайте вашей первой таблице внешний ключ.

Менее чем 65 535 различных мест? Это два байта на запись в вашей исходной таблице. Довольно хорошее сжатие, если вы спросите меня. Также ускоряет индексацию и сравнение.

Данные важнее кода. Получите данные правильно в первую очередь. По умолчанию максимально возможная нормализация . Денормализовать только после того, как вы обнаружили (конкретную, измеренную и полностью атрибутированную) проблему с производительностью или какую-либо серьезную причину.

0 голосов
/ 10 июля 2011

Вы хотите искать пространственный индекс. Си уменьшает 2d сложность до 1d сложности. Си используется в тепловых картах и ​​древовидных картах. Похоже на дерево.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...