Это в основном потому, что Spark на EMR не получает ваш пользовательский файл metrics.properties
из папки resources
толстой банки.
Для EMR предпочтительный способ настройки - через API EMR Configurations , в котором вам нужно передать classification
и properties
во встроенный JSON.
- Для подсистемы
spark metrics
приведен пример изменения пары метрик
[
{
"Classification": "spark-metrics",
"Properties": {
"*.sink.csv.class": "org.apache.spark.metrics.sink.CsvSink",
"*.sink.csv.period": "1"
}
}
]
Этот JSON можно использовать при создании кластера EMR с помощью консоли Amazon или через SDK
.