Python Группировка по совокупной и настраиваемой лямбде для большого количества столбцов - PullRequest
0 голосов
/ 26 марта 2020

У меня есть фрейм данных в форме 10000 x 1000. Мне нужно сгруппировать по нескольким столбцам из этого фрейма, а именно 'A' и 'B'. Теперь при группировании это означает, что я уменьшу количество строк в результате группировки.

Однако многие из этих столбцов нуждаются в различной обработке, которую можно объяснить их типами данных. Например, если имя столбца является датой-временем с именем «X», то мы агрегируем по минимуму, если это float64, то находим их сумму.

Теперь я нахожусь по адресу:

newdata = data.groupby(by = ['A', 'B'], as_index=True).agg(lambda x: np.min if x == "longest time" else (np.max if x == "shortest time" else np.sum))

Это не работает. Я искал через stackoverflow, и я не нашел решения для aggregate-lambda для большого количества столбцов. Помощь очень ценится

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...