Вы можете создать собственный оператор Hive, который наследует HiveOperator
в вашей DAG, как показано ниже:
class CustomHiveOp(HiveOperator):
def execute(context):
self.log.info('Executing: %s', self.hql)
self.hook = self.get_hook()
self.conn.to_csv(
hql=self.hql,
csv_filepath=self.output_filepath,
schema='default',
delimiter=',',
lineterminator='\r\n',
output_header=True,
fetch_size=1000,
hive_conf=None)
и использовать его как:
hive_csv = CustomHiveOp(
task_id='hive_to_csv',
hql='YOUR_HIVE_QUERY',
hive_cli_conn_id=''
)