Я пытаюсь создать счетчик, чтобы отслеживать количество неудач и успехов для нескольких разных пользователей. У меня есть фрейм данных с пользовательскими кодами, которые повторяются (если есть больше событий для одних и тех же пользователей), и временная метка для отслеживания временной переменной. Я хотел бы добавить два столбца (количество успехов, количество сбоев), которые суммируют результат предыдущих событий.
Пример данных:
data=pd.DataFrame(
{
'user_id': [2,2,3,2,4,5,3,3,6,6,6,7],
'timestamp': [1567641600,1567691600,1567741600,1567941600, 1567981600, 1567991600,1568391600,1568541600,1568741600,1568941600,1568981600,1568988600],
'status': ['yes','no','yes','no', 'yes', 'yes','yes','no','no','yes','no','yes']
}
)
Я пробовал с некоторыми циклами в R но боюсь, я чего-то упускаю, может быть, есть лучший способ сделать это в Python?
Желаемый результат будет примерно таким:
data=pd.DataFrame(
{
'user_id': [2,2,3,2,4,5,3,3,6,6,6,7],
'timestamp': [1567641600,1567691600,1567741600,1567941600, 1567981600, 1567991600,1568391600,1568541600,1568741600,1568941600,1568981600,1568988600],
'status': ['yes','no','yes','no', 'yes', 'yes','yes','no','no','yes','no','yes'],
'number_yes':[1,1,1,1,1,1,2,2,0,1,1,1],
'number_no':[0,1,0,2,0,0,0,1,1,1,2,0]
}
)