У меня есть фрейм данных в форме 10000 x 1000. Мне нужно сгруппировать по нескольким столбцам из этого фрейма, а именно 'A' и 'B'. Теперь при группировании это означает, что я уменьшу количество строк в результате группировки.
Однако многие из этих столбцов нуждаются в различной обработке, которую можно объяснить их типами данных. Например, если имя столбца является датой-временем с именем «X», то мы агрегируем по минимуму, если это float64, то находим их сумму.
Теперь я нахожусь по адресу:
newdata = data.groupby(by = ['A', 'B'], as_index=True).agg(lambda x: np.min if x == "longest time" else (np.max if x == "shortest time" else np.sum))
Это не работает. Я искал через stackoverflow, и я не нашел решения для aggregate-lambda для большого количества столбцов. Помощь очень ценится