Сбой удаленного подключения к [null] с java. net .NoRouteToHostException: нет маршрута к хосту в диспетчере задач - PullRequest
0 голосов
/ 01 мая 2020

Когда я запускаю свою службу диспетчера задач apache flink 1.10 в кластере kubernetes (v1.15.2), она показывает журналы, подобные этому:

2020-05-01 08:34:55,847 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutor            - Could not resolve ResourceManager address akka.tcp://flink@flink-jobmanager:6123/user/resourcemanager, retrying in 10000 ms: Could not connect to rpc endpoint under address akka.tcp://flink@flink-jobmanager:6123/user/resourcemanager..
2020-05-01 08:34:55,847 WARN  akka.remote.transport.netty.NettyTransport                    - Remote connection to [null] failed with java.net.NoRouteToHostException: No route to host
2020-05-01 08:34:55,848 WARN  akka.remote.ReliableDeliverySupervisor                        - Association with remote system [akka.tcp://flink@flink-jobmanager:6123] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink@flink-jobmanager:6123]] Caused by: [java.net.NoRouteToHostException: No route to host]
2020-05-01 08:35:08,874 WARN  akka.remote.transport.netty.NettyTransport                    - Remote connection to [null] failed with java.net.NoRouteToHostException: No route to host
2020-05-01 08:35:08,877 WARN  akka.remote.ReliableDeliverySupervisor                        - Association with remote system [akka.tcp://flink@flink-jobmanager:6123] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink@flink-jobmanager:6123]] Caused by: [java.net.NoRouteToHostException: No route to host]
2020-05-01 08:35:08,878 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutor            - Could not resolve ResourceManager address akka.tcp://flink@flink-jobmanager:6123/user/resourcemanager, retrying in 10000 ms: Could not connect to rpc endpoint under address akka.tcp://flink@flink-jobmanager:6123/user/resourcemanager..
2020-05-01 08:35:21,907 WARN  akka.remote.transport.netty.NettyTransport                    - Remote connection to [null] failed with java.net.NoRouteToHostException: No route to host

, и диспетчер задач не смог зарегистрировать успех, и я вошел в систему TaskManager и выяснить, я мог бы успешно ping JobManager, как это:

flink@flink-taskmanager-54d85f57c7-nl9cf:~$ ping flink-jobmanager
PING flink-jobmanager.dabai-fat.svc.cluster.local (10.254.58.171) 56(84) bytes of data.
64 bytes from flink-jobmanager.dabai-fat.svc.cluster.local (10.254.58.171): icmp_seq=1 ttl=64 time=0.045 ms
64 bytes from flink-jobmanager.dabai-fat.svc.cluster.local (10.254.58.171): icmp_seq=2 ttl=64 time=0.076 ms
64 bytes from flink-jobmanager.dabai-fat.svc.cluster.local (10.254.58.171): icmp_seq=3 ttl=64 time=0.079 ms

так почему это произойдет и что я должен сделать, чтобы это исправить?

1 Ответ

0 голосов
/ 02 мая 2020

Попробуйте установить nmap в контейнере pod вашего менеджера по задачам kubernetes:

apt-get udpate
apt-get install nmap -y

, затем просканируйте менеджер заданий и убедитесь, что порт 6123 доступа к модулю доступен (в моем случае я обнаружил, что не могу получить доступ к порту 6123 от текущего модуля).

nmap -T4 <your-jobmanager's-pod-ip>

Надеюсь, эта помощь.

...