Существуют лучшие практики, которые рекомендуют запускать Mirror Maker на целевом кластере.https://community.hortonworks.com/articles/79891/kafka-mirror-maker-best-practices.html
Интересно, почему эта рекомендация существует, потому что в конечном итоге все данные должны пересекать границу между кластерами, независимо от того, используются ли они на цели или получены на источнике.Причину, которую я могу себе представить, заключается в том, что Mirror Maker поддерживает несколько потребителей, но только одного производителя, поэтому использование данных в пути с большей задержкой может быть ускорено за счет использования нескольких потребителей.
Если производительность из-за несколькихмногопоточность - это вопрос, будет ли целесообразно использовать несколько производителей (по одному на каждого потребителя) для репликации данных (с помощью специального процесса репликации)?Кто-нибудь знает, почему Mirror Maker разделяет один источник среди всех потребителей?
Мой пример использования - репликация данных из нескольких исходных кластеров (~ 10) в один целевой кластер.Я бы предпочел запустить процесс репликации в исходном кластере, чтобы избежать многих процессов репликации (каждый для одного источника) в целевом кластере.
Советы и предложения по этой теме приветствуются.