Как избежать увеличения размера данных из-за объединения в SQL и сравнения значений в таблице? - PullRequest
0 голосов
/ 15 октября 2019

Мне нужна помощь в реструктуризации таблицы данных.

У меня есть таблица (xyz) с несколькими полями, такими как Регион, Штат, Город и т. Д., Где город - это подмножество штатов, которое является подмножествомобласть. Я хотел сравнить регионы со штатами и городами, поэтому я создал временную таблицу, сгруппировав данные на уровне региона (переименованный столбец региона в География и удалив столбцы штата и города), а затем создал другую временную таблицу, сгруппировав данные на уровне штата. (переименовал столбец состояния в Geography и удалил столбцы региона и города) и создал аналогичную таблицу для city.

Наконец, я сделал объединение, чтобы добавить эти таблицы в одну таблицу. Моя итоговая таблица теперь содержит остальные столбцы из предыдущей таблицы (xyz) и один столбец Geography со всей информацией о регионах, штатах и ​​городах. Теперь мне легко сравнить их производительность друг с другом в Таблице.

Выполнив это объединение, я, к сожалению, увеличил размер таблицы с 750 М записей до 2,4 В записей. Прямо сейчас я использую эту таблицу объединения в таблице, чтобы сделать свой анализ. Он работает нормально, но занимает около 20-30 секунд для загрузки данных и примерно в то же время, когда я делаю какие-либо изменения в Таблице.

Я пытался найти другой эффективный способ избежать объединения в SQL и до сих поруметь сравнивать регионы, стихи, города, стихи, города непосредственно в Таблице.

Кто-нибудь из вас знает, как обойти это? Пожалуйста, дайте мне знать. Спасибо!

...