У меня есть Pandas DataFrame, который выглядит следующим образом:
Вот проблема с набором данных: если был счетчик 0, тострока никогда не создавалась в предоставленном мне файле csv.Так, например, на неделе 6 есть только 2 записи (считается только 2 часа).Я хочу, чтобы на 6 неделе было 168 записей (поскольку на 1 неделе 168 часов), где 166 записей будут иметь 0 отсчетов.Таким образом, должны быть строки, такие как:
[год = 2018, неделя = 6, день недели = 1, час дня = 1, счетчик = 0, unit_id = бла, unit_label = бла]
[год = 2018, неделя = 6, день недели = 1, час дня = 2, число = 0, unit_id = бла, unit_label = бла]
...
[год = 2018, неделя = 6, день недели = 1, час дня = 23, количество = 1, unit_id = бла, unit_label = бла]
...
и т. д.и так далее.Оглядываясь вокруг, я догадываюсь, что мне нужно каким-то образом использовать "переиндексацию".Но я не могу просто напрямую использовать диапазоны дат, учитывая тот факт, что я хочу, чтобы эти очень специфические столбцы .Любой совет приветствуется.
Данные в виде текста:
{'count': {0: 5, 1: 1, 2: 1, 3: 8, 4: 1},'day_of_week': {0: 4, 1: 5, 2: 4, 3: 3, 4: 3},'hour_of_day': {0: 23, 1: 0, 2: 18, 3: 19, 4: 21},'unit_id': {0: 'bc9b8ac4-3c57-4fe1-9085-0e3d0b6233d6',1: 'bc9b8ac4-3c57-4fe1-9085-0e3d0b6233d6',2: '7a1efb1d-d4c1-47e1-9320-ff5707eae91e',3: '7a1efb1d-d4c1-47e1-9320-ff5707eae91e',4: '7a1efb1d-d4c1-47e1-9320-ff5707eae91e'},'unit_label': {0: '_debug TestPA',1: '_debug TestPA',2: '_TEMPORARILY_DISABLED_Jenn`s Favorite Destinations',3: '_TEMPORARILY_DISABLED_Jenn`s Favorite Destinations',4: '_TEMPORARILY_DISABLED_Jenn`s Favorite Destinations'},'week': {0: 29, 1: 29, 2: 46, 3: 51, 4: 51},'year': {0: 2017, 1: 2017, 2: 2015, 3: 2015, 4: 2015}}