Как настроить Hadoop, когда рабочие находятся за NAT с перегрузкой порта (PAT) - PullRequest
0 голосов
/ 12 мая 2019

У нас есть тупиковая сеть, которая находится за одним IP-адресом.Мы используем NAT и перегружаем этот IP через порты (IE PAT).В результате порт назначения используется для определения того, какой внутренний сервер следует переадресовать.Если внутренний сервер инициирует соединение, он определяет порт источника, к которому возвращаются возвращаемые пакеты.Это устанавливает запись перевода, которая включает порт.Пока внешний сервер сохраняет исходный порт, который он получил, и отправляет туда ответные пакеты, все в порядке.

Но если внешний сервер инициирует соединение, запись трансляции отсутствует.Пакет отбрасывается.

Мы хотели бы использовать серверы в этих тупиковых сетях как часть кластера Hadoop.Если бы мы могли, мы бы дали каждому свой внешний IP, но это просто невозможно.У нас только один IP-адрес, который используется 21 сервером.

Как настроить Hadoop в этом случае?

Мы думали, например, о настройке 21 статической записи NAT.У каждого свой порт на этом IP.

Например, предположим, что внешний IP-адрес - 1.2.3.4.и внутренние IP-адреса двух серверов в сети-заглушке равны 5.6.7.8 и 5.6.7.15

Итак, мы думали настроить статическую таблицу NAT таким образом, чтобы любой пакет, идущий к порту 1.2.3.4, транслировался в5.6.7.8 порт 50010. И любой пакет на порт 1.2.3.4 порта 2 преобразуется в порт 50010 5.6.7.15.

Это должно работать, если требуется настройка сети.Вопрос в том, можем ли мы настроить Hadoop для использования разных номеров портов для каждого узла данных?IE, есть ли способ заставить Hadoop искать и IP, и порт целевого узла данных?

...