У меня есть pf для данных pandas df, который выглядит как
userid trip_id segmentid actual prediction
1 13 40 3 3
1 6 2 1 1
1 44 3 2 3
2 70 19 1 1
2 12 5 0 0
Мне нужно создать итоговый кадр данных dfsummary, сгруппированный по столбцу ID пользователя , имеющий три столбца: идентификатор пользователя, правильный_классифицированный, неверный_классифицированный.Если фактические и прогнозные значения одинаковы, то они классифицируются правильно, иначе классифицируются некорректно.
Я могу посчитать correct_classfied на всем фрейме данных как
correct_classified = submission[(submission['Actual'] == submission['prediction'])]
incorrect_classified = submission[(submission['Actual'] != submission['prediction'])]
, но у меня нет идеи создать сводную таблицу, сгруппированную по идентификатору пользователя, которая должна выглядеть следующим образом
userid correct_classified incorrect_classified
1 2 1
2 2 0