Сделать существующую таблицу больших запросов кластеризованной - PullRequest
0 голосов
/ 29 августа 2018

У меня довольно большая существующая секционированная таблица в bigquery. Я хочу сделать таблицу кластеризованной, по крайней мере, для нового раздела.

Из документации: https://cloud.google.com/bigquery/docs/creating-clustered-tables, сказано, что мы можем Creating a clustered table when you load data, и я попытался загрузить новый раздел, используя поля кластеризации: job_config.clustering_fields = ["event_type"].

Загрузка успешно завершена, однако кажется, что новый раздел не кластеризован (я не совсем уверен, как проверить, кластеризован он или нет, но когда я запрашиваю этот конкретный раздел, он всегда сканирует все строки).

Есть ли хороший способ сделать поле кластеризации для существующей многораздельной таблицы?

Любые комментарии, предложения или ответы приветствуются.

Большое спасибо, Yosua

1 Ответ

0 голосов
/ 29 августа 2018

Вы можете указать столбцы кластеризации только при создании таблицы
Таким образом, очевидно, вы не можете ожидать, что существующие некластеризованные таблицы и особенно только новые разделы станут кластеризованными

«Обходной путь» - создать новую таблицу для правильного разбиения / кластеризации и загрузить в нее данные из GCS. Для этого вы можете сначала экспортировать данные из исходной таблицы в GSC, поэтому весь процесс будет бесплатным

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...