AutoML Tables поддерживает и BigQuery, и GCS в качестве источников. Вы можете использовать формат BigQuery URI для указания местоположения ваших данных тренировки, и он должен соответствовать следующему формату: bq://<project_id>.<dataset_id>.<table_id>
В DAG Airflow вы можете использовать AutoMLImportDataOperator
с input_config
, как показано ниже
IMPORT_INPUT_CONFIG = {"bigquery_source": {"input_uri": 'bq://{}.{}.{}'.format(project_id, bq_dataset, bq_table)}}
import_dataset_task = AutoMLImportDataOperator(
task_id="import_dataset_task",
dataset_id=dataset_id,
location=GCP_AUTOML_LOCATION,
input_config=IMPORT_INPUT_CONFIG,
)
Более подробный пример с GCS в качестве источника можно найти в примере «Воздушный поток» DAG здесь . Вы должны обновить IMPORT_INPUT_CONFIG
переменную с помощью BigQiuery URI.