Если у меня есть список дат в CSV-файле, я хочу найти и добавить недостающие интервалы в одном часовом интервале дня.
Данные выглядят следующим образом:
id city reading date
33 US-Ohio 06/18/2011 23:00:00
33 US-Ohio 06/19/2011 00:00:00
33 US-Ohio 06/19/2011 01:00:00
33 US-Ohio 06/19/2011 02:00:00
33 US-Ohio 06/19/2011 06:00:00
33 US-Ohio 06/19/2011 07:00:00
33 US-Ohio 06/19/2011 08:00:00
34 US-NYC 06/19/2011 06:00:00
34 US-NYC 06/19/2011 08:00:00
Итак, недостающие данные, которые нужно вставить:
id city reading date
33 US-Ohio 06/18/2011 23:00:00
33 US-Ohio 06/19/2011 00:00:00
33 US-Ohio 06/19/2011 01:00:00
33 US-Ohio 06/19/2011 02:00:00
06/19/2011 03:00:00
06/19/2011 04:00:00
33 US-Ohio 06/19/2011 06:00:00
33 US-Ohio 06/19/2011 07:00:00
33 US-Ohio 06/19/2011 08:00:00
34 US-NYC 06/19/2011 06:00:00
06/19/2011 07:00:00
34 US-NYC 06/19/2011 08:00:00
Я уже преобразовал их в datetime, используя pandas, используя код:
games['reading_date'] = pd.to_datetime(games['reading_date'], format='%m/%d/%y %H:%M')
Даты повторяются, поэтому установка индекса и повторная выборка не работают, потому что в разных городах разное время пропуска и индекс повторяется несколько раз, мне просто нужно добавить эти пропущенные почасовые интервалы и оставить все остальные столбцы пустыми.Как мне сделать это в Python?