Файлы паркета с мгновенным сжатием для клеевых столов, хранящиеся в S3 - PullRequest
0 голосов
/ 20 июня 2019

Я недавно присоединился к проекту, в котором мы используем таблицы Amazon Glue для запроса данных (с Spark-Sql), которые хранятся в файлах паркета с мгновенным сжатием на S3.Я совершенно новичок в этих технологиях и, следовательно, хочу изучать и собирать знания по этим темам -

1) AWS S3 (Architecture & CLI)
2) Parquet Files & Snappy compression and some practical knowledge as to how to inspect data in those files manually
3) AWS Glue tables and catalogs (architecture etc)

Может кто-нибудь указать мне правильное направление на любые онлайн (или другие) ресурсы, которые помогут мне понятьи приобретать знания по этим темам?Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...