Скорее всего, вы получаете доступ к корзине S3 в другом регионе. Либо для ваших данных, либо для записи журналов кластера EMR.
Есть несколько способов диагностировать это. Прежде всего, конечно, стоит взглянуть на конфигурацию вашего кластера EMR.
Второе - включить Журналы потока VPC , которые сообщат вам точный источник и место назначения ваших данных. Однако они могут быть ограничены: если вы управляете всем трафиком через NAT, то они просто покажут NAT, а не конечный источник / назначение.
Третий подход - использовать группу безопасности, которая предотвращает исходящие соединения, и посмотреть в своих журналах, чтобы увидеть, что дает сбой.