Я создаю фрейм данных dask из фрейма данных pandas с помощью функции from_pandas (). Когда я пытаюсь выбрать два столбца из кадра данных dask, используя квадратные скобки [[]], я получаю KeyError.
Согласно документации dask, фрейм данных dask поддерживает выбор столбцов в квадратных скобках, как и фрейм данных pandas.
# data is a pandas dataframe
dask_df = ddf.from_pandas(data, 30)
data = data[dask_df[['length', 'country']].apply(
lambda x: myfunc(x, countries),
meta=('Boolean'),
axis=1).compute()].reset_index(drop=True)
# This is the error I am getting:
KeyError: "None of [Index(['length', 'country'], dtype='object')] are in the [columns]"
Я думал, что это может быть связано с предоставлением правильной мета для применения, но из-за ошибки кажется, что dask dataframe не может выбрать два столбца, что должно произойтидо применения.
Это прекрасно работает, если я заменю «dask_df» на «data» (pandas df) в строке применения.
Не сохраняется ли индекс, когда я выполняю from_pandas?