У меня есть случай, когда мне нужно переместить данные из внутреннего кластера CDH в кластер AWS EMR.Я подумываю настроить NiFi на экземпляре AWS EC2, чтобы переместить данные из внутреннего кластера в хранилище AWS s3.
Все мои таблицы на кластере CDH хранятся в формате паркета.
Вопрос № 1: Есть ли у нас поддержка в NiFi, которая позволяет читать таблицы в формате паркета ??
ИЛИ
Единственный вариант, который у меня есть, - это читать данные напрямуюиз каталога hdfs и поместите его на s3, а затем создайте таблицу кустов в EMR?
Вопрос № 2: Как Nifi определяет новые данные, вставленные в таблицу, и считывает новые данные.В моем случае все таблицы разделены на ггггмм.