Мне нужна помощь в реструктуризации таблицы данных.
У меня есть таблица (xyz) с несколькими полями, такими как Регион, Штат, Город и т. Д., Где город - это подмножество штатов, которое является подмножествомобласть. Я хотел сравнить регионы со штатами и городами, поэтому я создал временную таблицу, сгруппировав данные на уровне региона (переименованный столбец региона в География и удалив столбцы штата и города), а затем создал другую временную таблицу, сгруппировав данные на уровне штата. (переименовал столбец состояния в Geography и удалил столбцы региона и города) и создал аналогичную таблицу для city.
Наконец, я сделал объединение, чтобы добавить эти таблицы в одну таблицу. Моя итоговая таблица теперь содержит остальные столбцы из предыдущей таблицы (xyz) и один столбец Geography со всей информацией о регионах, штатах и городах. Теперь мне легко сравнить их производительность друг с другом в Таблице.
Выполнив это объединение, я, к сожалению, увеличил размер таблицы с 750 М записей до 2,4 В записей. Прямо сейчас я использую эту таблицу объединения в таблице, чтобы сделать свой анализ. Он работает нормально, но занимает около 20-30 секунд для загрузки данных и примерно в то же время, когда я делаю какие-либо изменения в Таблице.
Я пытался найти другой эффективный способ избежать объединения в SQL и до сих поруметь сравнивать регионы, стихи, города, стихи, города непосредственно в Таблице.
Кто-нибудь из вас знает, как обойти это? Пожалуйста, дайте мне знать. Спасибо!