Есть идеи по ограничению строк для использования метода Numpy array_split
?
У меня есть dataframe
со строками + 6 м, и я хотел бы разбить его на примерно 20 кусков.
Моя попытка последовала, что описано в: Разделение большого кадра данных панд
с использованием Numpy и функции array_split, однако, будучи очень большим dataframe
, оно просто продолжается вечно.
My dataframe
- это df, который включает 8 столбцов и 6,6 миллиона строк.
df_split = np.array_split(df,20)
Есть идеи об альтернативном методе, чтобы разделить это?В качестве альтернативы также приветствуются советы по улучшению производительности фрейма данных.