Потоковое BigQuery и разделы: когда действительно оценивается _PARTITIONTIME? - PullRequest
0 голосов
/ 03 сентября 2018

_PARTITIONTIME представляет время (усеченное до дня), когда строка вставляется в BigQuery.

Однако, если присмотреться к механизму потоковой передачи (https://cloud.google.com/blog/products/gcp/life-of-a-bigquery-streaming-insert), мы можем увидеть 3 разных «времени вставки» при вставке строки в BigQuery:

  • время, когда строка получена «Потоковыми рабочими»
  • время сохранения строки в «Потоковом буфере»
  • время, когда строка извлекается рабочими, которые хранят ее в конечном хранилище (конденсаторе).

Кто-нибудь знает, какой из этих 3 моментов соответствует _PARTITIONTIME?

1 Ответ

0 голосов
/ 04 сентября 2018

Когда строка все еще находится в буфере потоковой передачи, _PARTITIONTIME для этой строки является нулевым; после извлечения строки время извлечения является _PARTITIONTIME для этой строки. Исключением является то, что, когда строка напрямую передается в раздел, «таблица $ 20180101». В этом случае _PARTITIONTIME всегда равен «2018-01-01».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...