В настоящее время я пытаюсь сделать запрос данных, которые хранятся в многораздельной таблице (разделение на дату)
данные выглядят так:
date, product_id, orders
2019-11-01, 1, 100
2019-11-01, 2, 200
2019-11-02, 1, 300
У меня есть сотни данных-разделы и миллионы строк за дату.
Теперь, если я хочу запросить, например, общее количество заказов для идентификатора продукта 1 и 2 за период 2 недели и сгруппировать по дате (чтобы показать на графике по дате), БД должна пойтидо 2 недель перегородок и выборки данных для них.
Этот процесс может занять много времени, когда количество продуктов велико или требуемый период времени велик.
Я читал, что AWS Redshift подходит для такого рода задач. Я подумываю о том, чтобы перенести мои секционированные таблицы (агрегированные аналитические данные за дату) на эту технологию, но мне интересно, действительно ли это то, что я должен сделать, чтобы эти запросы выполнялись намного быстрее.
Спасибо!