У меня есть набор данных для группировки в соответствии с 'user_id'
и 'contest_id'
, и среди них я должен отсортировать каждого пользователя в каждом конкурсе, который участвовал в конкурсе, на основе даты и времени в порядке возрастания.
Я попытался сначала сгруппировать данные в соответствии с contest_id
и user handle
, затем я попытался отсортировать даты в порядке возрастания с помощью sort_values после преобразования столбца datetime
в `to_datetime '
Когда я пытаюсь сохранить код, выдает ошибку
'' '
Excel doesn't support timezones in datetimes. Set the tzinfo in the
datetime/time object to None or use the 'remove_timezone' Workbook()
option
'' '
dftotal.groupby(["contestID", "userHandle"])
dftotal["registerDateTime"]=pd.to_datetime(dftotal.registerDateTime)
dftotal["RegistrationDateTime"] = dftotal["registerDateTime"]
dftotal["submitDateTime"] = pd.to_datetime(dftotal.submitDateTime)
dftotal["SubmissionDateTime"] = dftotal["submitDateTime"]
dftotal = dftotal.sort_values(by=['RegistrationDateTime'])
данные
contest_id user_id registration submission score
1234 abc 2012-01-09 2012-01-09 90
21:51:00+00:00 22:51:00+00:00
4489 pabc 2013-01-09 2013-01-09 39
21:51:00+00:00 22:55:00+00:00
1234 tiop 2012-01-09 2012-01-09 100
23:51:00+00:00 23:55:00+00:00
4489 pabceu 2013-01-09 2013-01-09 39
23:20:00+00:00 23:55:00+00:00
ожидается
contest_id user_id registration submission score
1234 abc 2012-01-09 2012-01-09 90
21:51:00+00:00 22:51:00+00:00
1234 tiop 2012-01-09 2012-01-09 100
23:51:00+00:00 23:55:00+00:00
4489 pabc 2013-01-09 2013-01-09 39
21:51:00+00:00 22:55:00+00:00
4489 pabceu 2013-01-09 2013-01-09 39
23:20:00+00:00 23:55:00+00:00