Ваши первые два метода были очень близки!
Это должно сработать:
dfs['yeah'] = ddf.to_datetime(dfs['IR_START_DATE']).dt.dayofweek
Обратите внимание на отсутствие compute()
- вы не хотите создавать фрейм данных для панд, вы хотитестолбец, чтобы вернуться к исходным данным обычным ленивым способом.
Для map_partitions
, вы могли бы сделать
def compute_dow(df):
date_time = ddf.to_datetime(df['IR_START_DATE']).dt
df['dow'] = date_time.dayofweek
return df
Обратите внимание, что мы передаем фрейм данных и получаемобратно данные кадра. Кроме того, было бы полезно при вызове map_partitions
предоставить аргумент meta=
, чтобы уменьшить количество необходимых выводов (прочитайте документацию по методу).