Загрузка SQL-запроса промежуточной таблицы - PullRequest
0 голосов
/ 03 марта 2012

У меня возникла серьезная проблема при загрузке промежуточной таблицы из хранилища данных.Мой запрос на загрузку промежуточной таблицы занимает более 24 часов. Три основные таблицы: item_ledger_entry = 12 миллионов, Value_Entry = 28 миллионов и Gl_Entry = 58 миллионов.Проблема заключается в предложении Group By, которое берет 95% стоимости CUP для SORT.Пожалуйста, помогите.

Спасибо заранее.Я могу отправить вам запрос по электронной почте, если потребуется.

1 Ответ

1 голос
/ 03 марта 2012

Голосование, чтобы закрыть слишком мало информации.

Типичные подходы:

  • Не загружать все данные. Вам действительно не нужно загружать неизмененные записи каждый день. У вас есть крошечные данные (мы отслеживаем 40 миллионов строк в день), но trcick не должен загружать данные, которые не изменились для начала.
  • Лучшее оборудование. Вы не говорите ничего, что вы используете.
  • Избегайте группового - что или? Непонятно из вашего вопроса.,

В общем: наймите специалиста. Серьезно - Это звучит как настоящий проект высокого класса, и люди зарабатывают деньги на своих знаниях. Если у вас есть проблемы на этом уровне, многие другие вещи могут быть неправильными, и подробный ответ далеко за пределы того, что вы можете задать здесь. Например - запрос может не быть вашей проблемой, hwole-подход может быть неудачным (как я уже сказал: избегать обработки данных для начала).

...