Запустите Flink с параллелизмом более 1 - PullRequest
0 голосов
/ 13 ноября 2018

Может быть, я просто скучаю по чему-то, но у меня просто нет больше идей, где искать.

Я читаю сообщения из 2 источников, делаю соединение на основе общего ключа и передаю все это Кафке.

val env = StreamExecutionEnvironment.getExecutionEnvironment 
env.setParallelism(3) 
... 
source1 
 .keyBy(_.searchId) 
 .connect(source2.keyBy(_.searchId)) 
 .process(new SearchResultsJoinFunction) 
 .addSink(KafkaSink.sink) 

, поэтому он отлично работает, когда я запускаю его локально, и также работает на кластере с Parallelism, установленным в 1, но с 3 больше нет.

Когда я разверну его на 1 диспетчере заданий и 3 менеджерах задач и переведу каждую задачу в состояние «РАБОТА», через 2 минуты (когда ничего не происходит, один из менеджеров задач) получает следующий журнал:
https://gist.github.com/zavalit/1b1bf6621bed2a3848a05c1ef84c689c#file-gistfile1-txt-L108

и все это просто отключается.

Буду признателен за любую подсказку.tnx, заранее.

1 Ответ

0 голосов
/ 14 ноября 2018

Проблема заключается в том, что этот диспетчер задач - flink-taskmanager-12-2qvcd (10.81.53.209) - не может связаться хотя бы с одним из других диспетчеров задач, а именно с flink-taskmanager-12-57jzd(10.81.40.124:46240).Вот почему задание действительно никогда не запускается.

Я бы проверил в журналах этот другой диспетчер задач, чтобы увидеть, что он говорит, и я бы также посмотрел конфигурацию вашей сети.Возможно, мешает брандмауэр?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...