Я изучаю новый EMR 6.0.0 с поддержкой Docker, чтобы принять решение, если мы хотим его использовать. Один из наших проектов написан в Scala 2.11. Но EMR 6.0.0 поставляется с Spark, построенным из Scala 2.12. Поэтому я переключился на 6.00-бета-версию Spark 2.4.3, созданную из Scala 2.11. Если он работает на 6.0.0-бета-версии, мы обновим наш код до Scala 2.12 и будем использовать 6.0.0.
Некоторые проблемы, с которыми я сталкиваюсь, это при попытке запустить мою Scala spark задание:
- При попытке прочитать паркет из S3 я получил сообщение об ошибке: java .lang.RuntimeException: невозможно создать временные каталоги: [/ mnt / s3]
- Когда Я попытался выполнить вызов API с помощью https, я получил ошибку: usun.security.validator.ValidatorException: сбой при создании пути PKIX: sun.security.provider.certpath.SunCertPathBuilderException: не удалось найти действительный путь сертификации для запрошенной цели.
- Когда он попытался прочитать файлы из S3, я получил ошибку: класс com.amazon.ws.emr.had oop .fs.EmrFileSystem не найден. Я смог взломать этот, пройдя путь по --jars. Возможно, не лучшее решение.
Я предполагаю, что мне нужно что-то установить либо во время bootstrap, либо в файле Docker.
Может кто-нибудь помочь, пожалуйста? Спасибо!