Одна вещь, которую вы можете рассмотреть, это выборка ваших таблиц вниз. Это хорошая практика для анализа данных в целом, чтобы ускорить вашу итерацию при написании кода.
Например, если у вас есть таблица, создайте привилегии, и у вас есть несколько мега-огромных таблиц X с ключом unique_id и некоторыми данными data_value
Если unique_id является числовым, почти в любой базе данных
create table sample_table as
select unique_id, data_value
from X
where mod(unique_id, <some_large_prime_number_like_1013>) = 1
даст вам случайную выборку данных для обработки ваших запросов, и вы сможете внутренне объединить вашу sample_table с другими таблицами, чтобы повысить скорость тестирования / результатов запроса. Благодаря выборке результаты вашего запроса должны примерно соответствовать тому, что вы получите. Обратите внимание, что номер, с которым вы моддируете, должен быть простым, иначе он не даст правильный пример. Приведенный выше пример сократит вашу таблицу до 0,1% от исходного размера (точнее 0,0987%).
Большинство баз данных также имеют лучшие методы выборки и случайных чисел, чем просто использование мода. Проверьте документацию, чтобы увидеть, что доступно для вашей версии.
Надеюсь, это поможет,
McPeterson