Производительность SQL - Как ускорить подсчет различий? - PullRequest
0 голосов
/ 31 августа 2018

Я новичок в T-SQL, и у меня проблема с производительностью. У меня есть набор данных с ~ 200 миллионами строк, и я считаю значения NULL для 7 столбцов.

Я попробовал две вещи:

  1. Запишите это в таблицу. Это займет 9 часов.

  2. В конечном итоге я хочу загрузить это в QlikSense. Поэтому я создал представление (5 секунд) и затем загрузил его в Qlik примерно за 7 часов.

Понятия не имею, как эта разница вообще возможна. Но есть ли способ быстро получить таблицу, которая содержит всю эту информацию менее чем за 4 часа? Может быть в любом формате.

Спасибо, спасибо.

редактировать Прежде всего, спасибо за вашу помощь. К сожалению, я не могу поделиться набором данных. Набор данных хранится в базе данных SQL. Я проиндексировал это несколькими способами. Это увеличило производительность, но, тем не менее, все еще медленно.

Ответы [ 2 ]

0 голосов
/ 31 августа 2018

Использовать Group By вместо Distinct, а затем считать. Distinct также сортирует результаты

0 голосов
/ 31 августа 2018

вы можете попробовать "примерный план выполнения", который говорит "отсутствующие индексы"

...