У меня пустая таблица Hive. У меня есть 18 заданий, которые я выполняю, и у каждого из них может быть фрейм данных, который мне нужно будет добавить в таблицу Hive с файлом parquet.
У меня есть что-то вроде этого:
df2.write.parquet(SOME_HDFS_DIR/my_table_dir)
Но это не совсем так. Нужно ли мне добавлять имя файла .parquet
и добавлять его каждый раз? Я видел синтаксис Scala, но не Python.