не легко.
«Журналы YARN» на самом деле не находятся в YARN, они фактически находятся на узлах-исполнителях Spark.Если агрегирование журналов YARN включено, то журналы хранятся в HDFS и доступны с сервера Spark History.
Промышленный шаблон развертывания заключается в настройке свойств Spark log4j для записи в файл с помощью средства пересылки журналов (например, Filebeat, Splunk, Fluentd), затем эти процессы собирают данные в поисковую систему, такую как Solr, Elasticsearch, Graylog, Splunk и т. Д. С помощью этих инструментов вы можете приблизительно отслеживать / искать / анализировать сообщения журнала вне CLI.