Я сейчас пытаюсь прочитать файл Parquet из Azure Blob Storage, используя Apache Drill. Я добавил файлы .jar для azure -storage-8.6.3.jar и получил oop - azure -3.2.1.jar.
Я могу прочитать * Файл 1028 * хранится в хранилище BLOB-объектов (см. Первый снимок экрана ниже), однако при попытке прочитать файл Parquet появляется следующая ошибка:
ОШИБКА [HY000] [MapR] [Drill] (1040) Drill не удалось выполнить запрос: SELECT * FROM az.default
. ./CLTYP/CLTYP_2020_04_29_09_57.parquet
LIMIT 100 [30038] Ошибка выполнения запроса. Подробности: [ОШИБКА СИСТЕМЫ: StorageException: Запрошенная операция не разрешена в текущем состоянии объекта.
Пожалуйста, обратитесь к журналам для получения дополнительной информации.
Затем я загрузил файл Parquet на свой ноутбук и смог исследовать его без каких-либо проблем (см. второй скриншот ниже).
Я новичок в Drill и не уверен, как поступить? Я не уверен, почему JSON читает работу, а Паркет - нет? Потратил некоторое время на поиск указанной ошибки c, которую я вижу, но безуспешно. Любая помощь по этому вопросу будет принята с благодарностью.
Я работаю: Apache Drill 1.17.0 на Windows 10 с MapR Drill ODB C Версия драйвера: 1.3.22.1055
Чтение JSON файл
Чтение файла Parquet с диска