Я создаю систему, которая получает много внешних событий, которые должны быть сохранены, а затем запрашиваться, чтобы получить представление о событиях.
Итак, у меня есть регистратор событий, который создает разделенные (со структурой папок) Файлы Avro. (Я подумал, что Avro будет подходящим форматом для журнала событий, поскольку он основан на строках).
Я изучал возможность использования Presto для этого. Однако единственные примеры, которые я нахожу с использованием файлов Avro, - это создание таблиц на основе схем с нуля.
- Можно ли вообще использовать существующие файлы Avro, которые хранятся в кластере Had oop в качестве table с Presto?
Я также заметил, что вам нужно указать схему в примерах, где создаются таблицы.
- Это также относится к существующим файлам Avro , даже если в них включена информация о схеме?
- Насколько хорошо Presto работает с изменением схем между разными файлами? Это вообще возможно?