Как преобразовать ORC файлы / таблицу в файл Parquet на месте? - PullRequest
0 голосов
/ 24 июня 2019

У меня в каталоге много файлов ORC. Я создал Внешнюю таблицу в Databricks, указывающую место, где находятся файлы ORC. Теперь пришло требование изменить ORC-файлы на паркетные, так как Table будет там.

Есть ли способ сделать это, например, преобразование на месте? Существует способ в таблице DELTA , но он работает только для уже существующих файлов паркета.

Или мне нужно перебирать каждый файл и конвертировать в паркет традиционным способом? как Получить данные в формате DataFrame и сохранить их в формате паркета.

...