Вы можете попробовать использовать другой новый экземпляр Dataproc вместо стандартного.
Например, вы можете создать экземпляр Dataproc с HUE (Hadoop User Experience)
, который является интерфейсом для обработки кластера Hadoop, созданного Cloudera. Преимущество здесь в том, что HUE имеет в качестве компонента по умолчанию Apache Impala. Он также имеет Pig, Hive и т. Д. Так что это довольно хорошее решение для использования Impala.
Другим решением будет создание собственного кластера в начале, но это не очень хорошая идея (по крайней мере, вы хотите все настроить). Таким образом, вы можете установить Impala.
Вот ссылка, для получения дополнительной информации:
https://github.com/GoogleCloudPlatform/dataproc-initialization-actions/tree/master/hue