Когда мы запускаем программу spark в oozie-hue, она завершается сбоем из-за того, что не может быть найдена база данных кустов "zdm_ssso".
Также, похоже, существует некоторая проблема конфигурации:
"Не успешно, Вероятная причина: новый клиент разговаривает со старым сервером. Продолжение без него. org.apache.thrift.transport.TTransportException "
2018-09-26 20:35:36,267 WARN [main] hive.metastore: set_ugi() not successful, Likely cause: new client talking to old server. Continuing without it.
org.apache.thrift.transport.TTransportException
at org.apache.thrift.transport.TIOStreamTransport.read(TIOStreamTransport.java:132)
at org.apache.thrift.transport.TTransport.readAll(TTransport.java:86)
искровая программа
public static void main(String[] args) throws IOException {
System.setSecurityManager(null);
String warehouseLocation = new File("spark-warehouse").getAbsolutePath();
SparkSession spark = SparkSession
.builder()
.appName("Java Spark Hive Example")
.master("yarn")
.config("spark.sql.warehouse.dir", warehouseLocation)
.config("spark.driver.maxResultSize", "3g")
.config("spark.debug.maxToStringFields", "10000")
.config("spark.sql.crossJoin.enabled", "true")
.enableHiveSupport()
.getOrCreate();
spark.conf().set("spark.driver.maxResultSize", "3g");
spark.sql("use database_example");
}
2018-09-26 22:02:01,535 INFO [main] org.apache.spark.deploy.yarn.Client:
client token: Token { kind: YARN_CLIENT_TOKEN, service: }
diagnostics: User class threw exception: org.apache.spark.sql.catalyst.analysis.NoSuchDatabaseException: Database 'database_example' not found;
ApplicationMaster host: 10.74.234.5
ApplicationMaster RPC port: 0
queue: default
queue user: administrador
start time: 1538010085426
final status: FAILED
tracking URL: https://br-pc-centos-02:26001/proxy/application_1537467570666_4459/
user: administrador