У меня есть фрейм данных с несколькими индексами, и я хочу зациклить этот фрейм данных, вытаскивая группы строк для обработки.
Я хочу перебрать все комбинации в мультииндексе, но для подмножества индекса, а не для всех. Я заранее не знаю, какими будут значения ключа / индекса, но я знаю, сколько их.
Например:
data1
key1 key2 key3
A A A 10
A A B 11
A B A 12
A B C 13
A C A 14
Предположим, меня интересует только key1 + key2.
Существует 3 уникальные комбинации key1 + key2:
(A A)
(A B)
(A C)
Первый раз в цикле я хотел бы извлечь:
data1
key1 key2 key3
A A A 10
A A B 11
Второй раз в цикле я хотел бы извлечь:
data1
key1 key2 key3
A B A 12
A B C 13
В третий раз за цикл я хотел бы извлечь:
data1
key1 key2 key3
A C A 14
Как мне это сделать?
Я ПОЛНЫЙ новичок на питоне, поэтому чем больше объяснений, тем лучше.
Спасибо
** РЕДАКТИРОВАТЬ В ОТВЕТ НА КОММЕНТАРИЙ НИЖЕ **
В псевдо-коде я изначально думал что-то вроде:
[1] groups = <get the set/list of unique key1+key2 groups in the main dataframe>
[2] for each group in groups
[3] df_thisGroup = <extract the rows of data for this group from the main dataframe>
[4] <process df_thisGroup, and save the results out into a new dataframe. No need to alter the main dataframe>
[5] <optional: remove this group from the main dataframe as we no longer need it, we have finished processing it. This might make processing later groups faster?>
[6] move to next group
Мой вопрос: как выполнить шаги [1] и [2] & [3]