Предложение 1: Извлеките свои данные.
Особенно, когда речь идет об источниках данных, которые являются платой за байт запроса, (Big Query, Athena, Etc) имеют большой смысл. В зависимости от того, насколько «свежие» данные должны быть для пользователей. (Конечно, все пользователи скажут, что «это единственный выход», но немного углубимся в это и посмотрите, что это может быть на самом деле.) Обновления могут быть запланированы всего на 15 минут. Реальная сила обновлений приходит в форме «инкрементных обновлений», при которых добавляются только новые записи (по индексу int или date.) Это отличный способ сократить расходы - если ваша база данных BigQuery секционирована - ( что и должно быть. ) Поскольку экстракты Tableau содержатся в файлах .hyper, являющихся структурой собственного дизайна / элемента управления Tableau, они чрезвычайно быстры и идеально оптимизированы для использования в Tableau.
Предложение 2: Создание 3 источников данных (или более). Сертифицируйте эти источники данных после проверки того, что они предоставляют правильную информацию. Предоставьте пользователям четкие описания.
- Оригинальный большой набор данных.
- Подмножество ~ 20 полей для 90%.
- Остаток полей для 10%
- Экстракт 1
- Экстракт 2
- Экстракт 3
Важно, что если имена полей совпадают в каждом источнике данных (то есть: никогда не изменялись вручную), тогда пользователю должно быть легко «масштабироваться» до больших наборов данных по мере необходимости. Это означает, что обычно они всегда могут начать с небольшого подмножества данных, чтобы начать свое исследование, а затем использовать функцию '1027 * replace datasource ', чтобы переключиться на другой источник данных, сохраняя при этом те же представления. (Хотя это не сработает, если вообще уменьшит масштаб.)