df = dd.read_csv('csv',usecols=fields,skip_blank_lines=True) len(df.iloc[0:5])
Приведенный выше код повышает
AttributeError: 'DataFrame' object has no attribute 'iloc'
пробовал ix loc, но не мог выбрать строки на основе индекса
Один из обходных путей - создать индекс в виде столбца, т.е. df_index, в вашем CSV-файле и использовать его следующим образом:
df_index
selection = (df[ df['df_index'].isin( list_of_indexes ) ]).compute()
Dask.dataframe не поддерживает iloc. Обычно довольно сложно получить доступ к какой-либо конкретной строке в CSV-файле, не прочитав все это в память.
iloc
Однако, если вам нужны только несколько строк в верхней части, я рекомендую использовать метод .head()
.head()
>>> df.head()