Я в Python, использую Pandas для этой манипуляции.
Форма моих данных (1488000, 10).
Мне нужно создать цикл, который будет группировать каждую отдельную категорию в 3-м столбце, WORKLOAD_NAME, и создавать собственный отдельный DF. 3-й столбец содержит около 66 категорий, поэтому Мне нужно 66 именованных и отдельных DF-файлов в результате этого цикла.
Вот как выглядят данные:

ЗДЕСЬ ЧТО Я ХОЧУ ДЛЯ КАЖДОГО ОТДЕЛЬНОГО DF-- разделенные DF по WORKLOAD_NAME:

Обратите внимание:
1) Я сделал это за 1 раз, но было бы неудовлетворительно делать это вручную еще 65 раз:
EDWARDLOAD_WL = data[data.WORKLOAD_NAME == 'EDWARDLOAD']
2) Я создал набор уникальных имен категорий, а затем попытался создать цикл следующим образом:

for i in workload_set:
[i]_WL = data[data.WORKLOAD_NAME == i ]
но это ничего не сделало для меня. Есть мысли?
3) Ласли, я попробовал это .groupBY ():
data_grouped = tuple(data.groupBy('WORKLOAD_NAME'))
data_grouped.head()
Но и это не сработало-- "AttributeError: объект DataFrame не имеет атрибута groupBy"