как делать большие запросы: проекция набора данных - PullRequest
0 голосов
/ 06 апреля 2020

Google, похоже, открывает новую (бета) функцию для Передача данных BigQuery: проекция данных .

Похоже, мы можем скопировать все таблицы с выборкой данных в другой набор данных.

К сожалению, нет документации о том, как перенести выборку таблиц из одного набора данных в другой. В определении источника просят фильтры, но не знают, как их заполнить (см. Скриншот ниже). Подсказка с вопросительным знаком рядом с «фильтром ввода» не помогает, так как говорит: «Используйте фильтры для получения среза набора данных при наборе данных проекта в BigQuery».

Что сбивает с толку, так это число таблиц в исходном наборе данных, поэтому не похоже на запись фильтров, указывающих c на таблицу, как в SQL. Скорее я ожидаю что-то вроде: хорошо, возьмите 20% строк в зависимости от распределения данных по возможным полям ... (надеюсь)

Кто-нибудь знает, как написать фильтры здесь?

Data Source Definition and Filters

1 Ответ

0 голосов
/ 07 апреля 2020

Спасибо за руководство "Бен П". Я думаю, что все еще невозможно получить репрезентативную выборку из данных. Это скорее запрос SELECT с некоторым расширенным регулярным выражением для столбцов.

Я думаю, что из-за бета-версии здесь не подходит для публикации документа. Но в документе показано, как получить некоторые столбцы и строки в соответствии с обычными фильтрами SELECT / WHERE со значением предиката.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...