В случае, если вы не хотите sh вычислять, как предлагает Раджни sh kumar, вы также можете использовать что-то вроде следующего:
import dask.dataframe as dd
import pandas as pd
import numpy as np
my_df = [{"a": 1, "b": 2}, {"a": 2, "b": 3}]
df = pd.DataFrame(my_df)
dask_df = dd.from_pandas(df, npartitions=2)
dask_df["c"] = dask_df.apply(lambda x: x["a"] < 2,
axis=1,
meta=pd.Series(name="c", dtype=np.bool))
dask_df.compute()
Вывод:
a b c
0 1 2 True
1 2 3 False
Условие (здесь проверка, применяется ли запись в столбце "a" < 2
) построчно. Обратите внимание, что в зависимости от вашего состояния и зависимостей в нем это может быть не так просто, но в этом случае вы можете поделиться дополнительной информацией о том, что влечет за собой ваше состояние.