выбрать несколько строк по индексу из dask dataframe? - PullRequest
0 голосов
/ 30 апреля 2018
df = dd.read_csv('csv',usecols=fields,skip_blank_lines=True)
len(df.iloc[0:5])

Приведенный выше код повышает

AttributeError: 'DataFrame' object has no attribute 'iloc'

пробовал ix loc, но не мог выбрать строки на основе индекса

Ответы [ 2 ]

0 голосов
/ 10 сентября 2018

Один из обходных путей - создать индекс в виде столбца, т.е. df_index, в вашем CSV-файле и использовать его следующим образом:

selection = (df[ df['df_index'].isin( list_of_indexes ) ]).compute()
0 голосов
/ 01 мая 2018

Dask.dataframe не поддерживает iloc. Обычно довольно сложно получить доступ к какой-либо конкретной строке в CSV-файле, не прочитав все это в память.

Однако, если вам нужны только несколько строк в верхней части, я рекомендую использовать метод .head()

>>> df.head()
...