Короче говоря, то, что вы пытаетесь достичь, невозможно.
Причина: HDFS - это реализация Hadoop FileSystem API - которая моделируется на основе поведения файловой системы POSIX.
Хотя файловая система EMR (EMRFS) - это хранилище объектов в ядре, которое имитирует HDFS, которую все кластеры Amazon EMR используют для чтения и записи обычных файлов из Amazon EMR непосредственно в Amazon S3. Он по-прежнему нарушает некоторые требования API Hadoop FileSystem, которые можно считать заменой HDFS. См. Раздел «Хранилища объектов и файловые системы» в приведенной выше ссылке.
С учетом вышесказанного вы все равно можете использовать Amazon S3 в качестве опции хранения в EMR, не конфигурируя ничего, просто используя схему URI s3: // .
Надеюсь, это ответит на ваш вопрос.