У меня есть конвейер, который выглядит как класс с некоторыми методами. В каждом методе я обрабатываю некоторые данные. Пример:
class Pipeline:
def load_users(self):
pass
def load_sessions(self):
pass
Должен ли я инициализировать новый сеанс spark в каждом методе с помощью пользовательской конфигурации? Или лучше инициализировать его один раз в __init__
методе?