У меня есть датафрейм dask с индексом по одному из столбцов.Проблема в том, что если я выполняю df.head (), он всегда возвращает пустой df, тогда как df.tail всегда возвращает правильный df.Я проверял, что df.head всегда проверяет наличие первых n записей в первом разделе.Так что, если я делаю df.reset_index (), он должен работать, но это не так
Ниже приведен код для воспроизведения этого:
import dask.dataframe as dd
import pandas as pd
data = pd.DataFrame({
'i64': np.arange(1000, dtype=np.int64),
'Ii32': np.arange(1000, dtype=np.int32),
'bhello': np.random.choice(['hello', 'Yo', 'people'], size=1000).astype("O")
})
daskDf = dd.from_pandas(data, chunksize=3)
daskDf = daskDf.set_index('bhello')
print(daskDf.head())