Я хочу расширить функцию чтения / записи pyspark. sql .DataFrame для нужд моего собственного проекта. Для этого я создаю следующее
import pyspark.sql
class DataFrame(pyspark.sql.DataFrame):
def __init__(self, *args, **kwargs):
super().__init__(*args, **kwargs)
def write(self, format="parquet", version=True):
if format=="some_format":
# do something
super().write.format(format).save(path)
Проблема в том, что в коде мы создаем экземпляр объекта суперкласса, подобного этому data = spark.range(0, 5)
Как мне go преобразовать фрейм данных Spark для моего пользовательского чтения / write метод с минимальными изменениями. Возможно ли это