Запросить существующие (разделенные) файлы Avro с помощью Presto - PullRequest
0 голосов
/ 14 июля 2020

Я создаю систему, которая получает много внешних событий, которые должны быть сохранены, а затем запрашиваться, чтобы получить представление о событиях.

Итак, у меня есть регистратор событий, который создает разделенные (со структурой папок) Файлы Avro. (Я подумал, что Avro будет подходящим форматом для журнала событий, поскольку он основан на строках).

Я изучал возможность использования Presto для этого. Однако единственные примеры, которые я нахожу с использованием файлов Avro, - это создание таблиц на основе схем с нуля.

  • Можно ли вообще использовать существующие файлы Avro, которые хранятся в кластере Had oop в качестве table с Presto?

Я также заметил, что вам нужно указать схему в примерах, где создаются таблицы.

  • Это также относится к существующим файлам Avro , даже если в них включена информация о схеме?
  • Насколько хорошо Presto работает с изменением схем между разными файлами? Это вообще возможно?
...