Ошибка чтения файла паркета из Azure хранилища BLOB-объектов с использованием Apache Drill - PullRequest
2 голосов
/ 04 мая 2020

Я сейчас пытаюсь прочитать файл Parquet из Azure Blob Storage, используя Apache Drill. Я добавил файлы .jar для azure -storage-8.6.3.jar и получил oop - azure -3.2.1.jar.

Я могу прочитать * Файл 1028 * хранится в хранилище BLOB-объектов (см. Первый снимок экрана ниже), однако при попытке прочитать файл Parquet появляется следующая ошибка:

ОШИБКА [HY000] [MapR] [Drill] (1040) Drill не удалось выполнить запрос: SELECT * FROM az.default. ./CLTYP/CLTYP_2020_04_29_09_57.parquet LIMIT 100 [30038] Ошибка выполнения запроса. Подробности: [ОШИБКА СИСТЕМЫ: StorageException: Запрошенная операция не разрешена в текущем состоянии объекта.
Пожалуйста, обратитесь к журналам для получения дополнительной информации.

Затем я загрузил файл Parquet на свой ноутбук и смог исследовать его без каких-либо проблем (см. второй скриншот ниже).

Я новичок в Drill и не уверен, как поступить? Я не уверен, почему JSON читает работу, а Паркет - нет? Потратил некоторое время на поиск указанной ошибки c, которую я вижу, но безуспешно. Любая помощь по этому вопросу будет принята с благодарностью.

Я работаю: Apache Drill 1.17.0 на Windows 10 с MapR Drill ODB C Версия драйвера: 1.3.22.1055

Чтение JSON файл

Чтение файла Parquet с диска

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...