KeyError: "Ни один из [Index (['', ''], dtype = 'object')] не находится в [столбцах]" при попытке выбрать столбцы в кадре данных dask - PullRequest
0 голосов
/ 04 октября 2019

Я создаю фрейм данных dask из фрейма данных pandas с помощью функции from_pandas (). Когда я пытаюсь выбрать два столбца из кадра данных dask, используя квадратные скобки [[]], я получаю KeyError.

Согласно документации dask, фрейм данных dask поддерживает выбор столбцов в квадратных скобках, как и фрейм данных pandas.

# data is a pandas dataframe
dask_df = ddf.from_pandas(data, 30)

  data = data[dask_df[['length', 'country']].apply(
      lambda x: myfunc(x, countries),
      meta=('Boolean'),
      axis=1).compute()].reset_index(drop=True)


# This is the error I am getting: 
KeyError: "None of [Index(['length', 'country'], dtype='object')] are in the [columns]"

Я думал, что это может быть связано с предоставлением правильной мета для применения, но из-за ошибки кажется, что dask dataframe не может выбрать два столбца, что должно произойтидо применения.

Это прекрасно работает, если я заменю «dask_df» на «data» (pandas df) в строке применения.

Не сохраняется ли индекс, когда я выполняю from_pandas?

...