У меня есть пакетное задание в одном EMR (кластер Spark), которое выполняет массовую вставку в другой EMR (кластер HBase). Оба EMR расположены в одной частной подсети.
Как я могу контролировать пропускную способность между двумя EMR? AFAIK они не используют NAT Gateay, верно? Могу ли я иметь показатели только для передачи данных EMR в EMR, если в той же подсети работает какой-то другой персонал? Предположим, что другие задания Spark выполняют сильные перетасовки.
PS Действительно ли AWS предоставляет вам ~ 10 гигабит/ сек пропускная способность между экземплярами EC2 в одном и том же AZ? Распределяется ли эта пропускная способность между всеми экземплярами в одной подсети?