Я работаю над решением для данных, где необходимо обработать некоторые метаданные, используя сервисы AWS, используя EMR или Glue. Источник метаданных - Informatica Data Catalog
, который принадлежит другой организации. Я никогда не работал в Informatica.
Я ищу лучший способ извлечения метаданных из Informatica Data Catalog
. Мне приходят на ум следующие подходы:
Informatica Data Catalog
помещает данные в некоторую базу данных и дает нам доступ к соединению. Informatica Data Catalog
записывает данные в виде файлов и помещает их в какое-то хранилище, откуда мы можем получить доступ к данным и хранить их в S3-контейнерах. - Предоставляет ли
Informatica Data Catalog
какой-либо REST API, который вызывается для извлечения данных из него?
Out Из вышесказанного, какой подход предпочтительнее? Кроме того, дайте мне знать, если есть какой-либо другой подход для достижения того же, что и мой первый проект по разработке данных.