Я хотел бы сохранить огромный фрейм данных pyspark в виде таблицы Hive. Как я могу сделать это эффективно? Я хочу использовать saveAsTable (имя, формат = нет, режим = нет, partitionBy = нет, ** параметры) из pyspark.sql.DataFrameWriter.saveAsTable .
# Let's say I have my dataframe, my_df
# Am I able to do the following?
my_df.saveAsTable('my_table')
У меня вопрос, какие форматы доступны для использования и где я могу найти эту информацию для себя? OrcSerDe вариант? Я все еще учусь об этом. Спасибо.