У меня есть датафрейм. Следующий код работает
stat = working_data.groupby(by=['url', 'bucket_id'],
as_index=False).agg({'delta': 'max','id': 'count'})
Теперь мне нужно посчитать идентификаторы с разными статусами. У меня есть «ЗАГРУЗЕНО», «НЕ_УКАЗАНО» и «ЗАГРУЗКА» для статуса.
Я хотел бы иметь df
со столбцами bucket_id
, max
, downloaded
(у скольких из них «СКАЧАТЬ»«status», not_downloaded
(сколько имеет статус «NOT_DOWNLOADED»), downloading
(сколько имеет статус «DOWNLOADING»). Как это сделать?
Входные данные у меня есть:
.
Выходные данные у меня есть: ![enter image description here](https://i.stack.imgur.com/2AUv1.png)
Как видите, количество не делится на статус. Но я хочу знать, что x загружено, y not_downloaded, z загружается для каждого bucket_id bucket_id (поэтому они должны быть в отдельных столбцах, но информация для одного bucket_id должна находиться в одной строке)