Я некоторое время боролся с квестом pandas, и, возможно, кто-то может пролить новый свет на эту проблему:)
Подумайте о том, чтобы следовать pandas фрейму данных, df :
Year Month Task TaskID TaskClass TaskClassID SomeValue
2019 11 A 1 X 10 6.58
2019 11 A 1 Y 20 1.58
2019 11 B 2 X 10 6.58
2019 11 B 2 Y 20 1.58
цель: группировка по Задача таким образом, что каждая Задача получает уникальный TaskClass наблюдение (которое Tasks получает TaskClass не имеет значения для этой проблемы, может считаться случайным). как это:
Year Month Task TaskID TaskClass TaskClassID SomeValue
2019 11 A 1 X 10 6.58
2019 11 B 2 Y 20 1.58
или, например, это:
Year Month Task TaskID TaskClass TaskClassID SomeValue
2019 11 A 1 Y 20 1.58
2019 11 B 2 X 10 6.58
другие ограничения конечная проблема будет иметь тысячи задач и, что более важно, может иметь больше TaskClass за Task , что-то вроде этого:
Year Month Task TaskID TaskClass TaskClassID SomeValue
2019 11 A 1 X 10 6.58
2019 11 A 1 Y 20 1.58
2019 11 A 1 Z 30 1.00
2019 11 A 1 W 40 0.25
2019 11 B 2 X 10 6.58
2019 11 B 2 Y 20 1.58
2019 11 B 2 Z 30 1.00
2019 11 B 2 W 40 0.25
Заранее всем спасибо.