разбиение кадра данных на куски и присвоение имени каждому новому фрагменту в кадре данных - PullRequest
0 голосов
/ 15 ноября 2018

Есть ли хороший код, чтобы разбить кадры данных на куски и автоматически присвоить каждому блоку имя в отдельном кадре данных?

например, dfmaster имеет 1000 записей. разделить на 200 и создать df1, df2,… .df5 Любое руководство будет высоко ценится.

Я смотрел на другие доски, и нет никаких указаний на функцию, которая может автоматически создавать новые кадры данных.

Ответы [ 2 ]

0 голосов
/ 15 ноября 2018

Используйте numpy для разделения:

См. Пример ниже:

In [2095]: df
Out[2095]: 
     0     1     2    3     4    5     6     7     8     9     10
0  0.25  0.00  0.00  0.0  0.00  0.0  0.94  0.00  0.00  0.63  0.00
1  0.51  0.51   NaN  NaN   NaN  NaN   NaN   NaN   NaN   NaN   NaN
2  0.54  0.54  0.00  0.0  0.63  0.0  0.51  0.54  0.51  1.00  0.51
3  0.81  0.05  0.13  0.7  0.02  NaN   NaN   NaN   NaN   NaN   NaN

In [2096]: np.split(df, 2)
Out[2096]: 
[     0     1    2    3    4    5     6    7    8     9    10
 0  0.25  0.00  0.0  0.0  0.0  0.0  0.94  0.0  0.0  0.63  0.0
 1  0.51  0.51  NaN  NaN  NaN  NaN   NaN  NaN  NaN   NaN  NaN,
      0     1     2    3     4    5     6     7     8    9     10
 2  0.54  0.54  0.00  0.0  0.63  0.0  0.51  0.54  0.51  1.0  0.51
 3  0.81  0.05  0.13  0.7  0.02  NaN   NaN   NaN   NaN  NaN   NaN]

df разбивается на 2 кадра данных, имеющих 2 строк в каждом.

Вы можете сделать np.split(df, 500)

0 голосов
/ 15 ноября 2018

Я нахожу эти идеи полезными:

решение через список: https://stackoverflow.com/a/49563326/10396469

решение с использованием numpy.split: https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.split.html

просто сначала используйте df = df.values для преобразования из фрейма данных в numpy.array.

...