Использование метаданных из каталога данных Informatica в AWS S3 или базу данных - PullRequest
0 голосов
/ 08 апреля 2020

Я работаю над решением для данных, где необходимо обработать некоторые метаданные, используя сервисы AWS, используя EMR или Glue. Источник метаданных - Informatica Data Catalog, который принадлежит другой организации. Я никогда не работал в Informatica.

Я ищу лучший способ извлечения метаданных из Informatica Data Catalog. Мне приходят на ум следующие подходы:

  1. Informatica Data Catalog помещает данные в некоторую базу данных и дает нам доступ к соединению.
  2. Informatica Data Catalog записывает данные в виде файлов и помещает их в какое-то хранилище, откуда мы можем получить доступ к данным и хранить их в S3-контейнерах.
  3. Предоставляет ли Informatica Data Catalog какой-либо REST API, который вызывается для извлечения данных из него?

Out Из вышесказанного, какой подход предпочтительнее? Кроме того, дайте мне знать, если есть какой-либо другой подход для достижения того же, что и мой первый проект по разработке данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...