Я создаю синхронизатор данных, который фиксирует изменение данных из MySQL Source и экспортирует данные в куст.
Я решил использовать Kafka Connect для реализации этого. Я использую Debezium в качестве соединителя источника и confluent hdfs в качестве соединителя приемника.
Но проблема в том, что соглашение об именах Debezium для Kafka topi c выглядит примерно так:
serverName.databaseName.tableName
В конфлюентных свойствах приемника hdfs я должен настроить topics
так же, как сгенерированный Debezium:
"topics": "serverName.databaseName.tableName"
Соединительный коннектор приемника hdfs будет генерировать путь в HDFS, например:
/topics/serverName.databaseName.tableName/partition=0
, что определенно вызовет некоторые проблемы в HDFS / Hive, поскольку путь содержит синтаксис .
, фактически, внешняя таблица, автоматически сгенерированная сливным коннектором приемника hdfs, не удалась из-за проблемы с путём. этот сливной коннектор приемника hdfs, созданный через имя c topi?