Я полагаю, что проблема может заключаться в том, что ваше хранилище мета было инициализировано из более старой версии Dataproc и, следовательно, имеет устаревшую схему.
Если у вас есть отказавший кластер (если нет, создайте новый, как и раньше,Вы можете использовать опцию --single-node
для снижения стоимости), затем SSH к главному узлу и обновить схему:
$ gcloud compute ssh my-cluster-m
$ /usr/lib/hive/bin/schematool -dbType mysql -info
Hive distribution version: 2.3.0
Metastore schema version: 2.1.0 <-- you will need this
org.apache.hadoop.hive.metastore.HiveMetaException: Metastore schema version is
not compatible. Hive Version: 2.3.0, Database Schema Version: 2.1.0
*** schemaTool failed ***
$ /usr/lib/hive/bin/schematool -dbType mysql -upgradeSchemaFrom 2.1.0
К сожалению, этот кластер не может быть возвращен в рабочее состояние, поэтому удалите и заново создайте его.
Я создал этот PR, чтобы сделать проблему более заметной: https://github.com/GoogleCloudPlatform/dataproc-initialization-actions/pull/278