Как создать цикл для создания отдельных PD-фреймов в Python 3 - PullRequest
0 голосов
/ 23 июня 2018

Я в Python, использую Pandas для этой манипуляции. Форма моих данных (1488000, 10).

Мне нужно создать цикл, который будет группировать каждую отдельную категорию в 3-м столбце, WORKLOAD_NAME, и создавать собственный отдельный DF. 3-й столбец содержит около 66 категорий, поэтому Мне нужно 66 именованных и отдельных DF-файлов в результате этого цикла.

Вот как выглядят данные:

enter image description here

ЗДЕСЬ ЧТО Я ХОЧУ ДЛЯ КАЖДОГО ОТДЕЛЬНОГО DF-- разделенные DF по WORKLOAD_NAME:

enter image description here

Обратите внимание:

1) Я сделал это за 1 раз, но было бы неудовлетворительно делать это вручную еще 65 раз:

EDWARDLOAD_WL = data[data.WORKLOAD_NAME == 'EDWARDLOAD']

2) Я создал набор уникальных имен категорий, а затем попытался создать цикл следующим образом: enter image description here

for i in workload_set:
    [i]_WL = data[data.WORKLOAD_NAME == i ]

но это ничего не сделало для меня. Есть мысли?

3) Ласли, я попробовал это .groupBY ():

data_grouped = tuple(data.groupBy('WORKLOAD_NAME'))
data_grouped.head()

Но и это не сработало-- "AttributeError: объект DataFrame не имеет атрибута groupBy"

1 Ответ

0 голосов
/ 02 ноября 2018

Мне удалось сохранить отдельные файлы в Excel:

names = df['WORKLOAD_NAME'].unique()
for n in names:
    df[df['WORKLOAD_NAME']==n].to_excel(n+'.xlsx')
...