Question

Я новичок в T-SQL, и у меня проблема с производительностью. У меня есть набор данных с ~ 200 миллионами строк, и я считаю значения NULL для 7 столбцов.

Я попробовал две вещи:

Запишите это в таблицу. Это займет 9 часов.
В конечном итоге я хочу загрузить это в QlikSense. Поэтому я создал представление (5 секунд) и затем загрузил его в Qlik примерно за 7 часов.

Понятия не имею, как эта разница вообще возможна. Но есть ли способ быстро получить таблицу, которая содержит всю эту информацию менее чем за 4 часа? Может быть в любом формате.

Спасибо, спасибо.

редактировать Прежде всего, спасибо за вашу помощь. К сожалению, я не могу поделиться набором данных. Набор данных хранится в базе данных SQL. Я проиндексировал это несколькими способами. Это увеличило производительность, но, тем не менее, все еще медленно.

Alexey Khrenov · Answer 1 · 31 августа 2018

Использовать Group By вместо Distinct, а затем считать. Distinct также сортирует результаты

Serkan Ekşioğlu · Answer 2 · 31 августа 2018

вы можете попробовать "примерный план выполнения", который говорит "отсутствующие индексы"

Производительность SQL - Как ускорить подсчет различий?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Производительность SQL - Как ускорить подсчет различий?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы