Вам необходимо включить банку для spark-bigquery-разъема с вашим spark-submit
. Самый простой способ сделать это - использовать флаг --jars
, чтобы включить общедоступную и самую последнюю версию соединителя:
spark-submit --jars gs://spark-lib/bigquery/spark-bigquery-latest.jar my_job.py
Хотя примеры ссылаются на Cloud Dataproc, это должно работатьпри отправке в любой кластер Spark.