Как BigQuery обрабатывает данные? - PullRequest
0 голосов
/ 24 марта 2019

Мой вопрос о том, как BigQuery обрабатывает данные.Когда я запускаю этот простой запрос к таблице сеансов

SELECT
  fullVisitorId
from
  `Project_1.Dataset_1.ga_sessions_*`
WHERE
  1=1
  AND REGEXP_EXTRACT(_TABLE_SUFFIX, r'(\d+)') >= '20190324'

, я получаю сообщение

Query complete (0.7 sec elapsed, 35.7 KB processed)

Однако, когда я сохраняю строку '20190324' в таблице с именем 'temp' иПовторите запрос, заменив «20190324» на результат запроса

SELECT
  fullVisitorId
from
  `Project_1.Dataset_1.ga_sessions_*`
WHERE
  1=1
  AND REGEXP_EXTRACT(_TABLE_SUFFIX, r'(\d+)') >= (select dd from temp)

, тогда количество времени и объем обработки данных резко возрастут:

Query complete (20.5 sec elapsed, 784.3 MB processed)

Кто-то может ожидать эти два запросатребовать одинакового времени обработки и данных.Мне было интересно, есть ли у кого-нибудь понимание того, почему это происходит.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...