Обработка таблиц в табличной модели, как они готовы - PullRequest
0 голосов
/ 21 июня 2019

Мы собираем данные из множества различных источников и помещаем все данные в одну табличную модель.

Сейчас мы ждем, пока у нас все данные, и затем обрабатываем модель.Однако это означает, что самый медленный источник данных решает, когда данные будут готовы.

Мне было интересно, можно ли начать обработку таблиц в шахматном порядке.

Это будет выглядеть так:

  1. в 6.03. Источник данных выполнен в EDW, и мы начинаем обработку его таблицы фактов в модели.
  2. в 6.10 DS 2 завершена, и таблица фактов 2 начинает обработку,Таблица фактов 1 все еще обрабатывает
  3. в 6.23. Таблица фактов 1 завершает обработку, и пользователи могут видеть новые данные
  4. в 6.55. Таблица фактов 2 заканчивает обработку, и пользователи могут видеть новые данные.
  5. в 7.10 ds 3 завершено, и фактабильная 3 начинает обработку
  6. и т. Д.

Я провел несколько небольших тестов, но я не нашеллюбая документация о том, как табличная SSAS реагирует на новые запросы обработки во время обработки, и, что более важно, если это хорошо для производительности.Наша другая стратегия -

  1. в 6:00 утра. Мы проверяем, какие таблицы установили контрольную точку, а какая нет
  2. в 6.03. Факту 1 выполнено, мы установили контрольную точку в контрольной таблице.
  3. в 6.14 Facttable 2 выполнен, и его контрольная точка установлена ​​в
  4. в 6.15, мы проверяем, какие таблицы установили контрольную точку и запускаем параллельный процесс в SSAS для этих двух таблиц
  5. в 6:30 мы видим, что мы обрабатываем и не начинаем новую обработку
  6. в 6,51 обработка выполняется
  7. в 7:00 утра. Мы проверяем, какие таблицы установили контрольную точку, которая не равна
  8. в 7.10 фактабильно 3 выполнено и контрольная точка установлена ​​
  9. и т. Д.

Последний будет работать, но мы будем уязвимы для точного времени законченногостолы.Если таблица с большим временем обработки начинает обрабатываться раньше, последующие таблицы не начнут обрабатываться слишком поздно, однако я не уверен, что первая возможность фактически сделает данные доступными быстрее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...