df = pd.read_csv(
'https://media-doselect.s3.amazonaws.com/generic/MJjpYqLzv08xAkjqLp1ga1Aq/Historical_Data.csv')
df.head()
Date Article_ID Country_Code Sold_Units
0 20170817 1132 AT 1
1 20170818 1132 AT 1
2 20170821 1132 AT 1
3 20170822 1132 AT 1
4 20170906 1132 AT 1
У меня есть вышеуказанный DataFrame. Обратите внимание, что столбец «Дата» имеет тип int64 и содержит пропущенные даты 19-го и 20-го числа.
Я хочу перевести его в формат гггг-мм-дд и вменять пропущенные даты со значениями 0 в идентификаторе статьи, код выпускаи проданные единицы.
До сих пор я пытался:
df['Date'] = pd.to_datetime(df['Date'].astype(str), format='%Y-%m-%d')
, чтобы получить даты в необходимом формате.
Date Article_ID Outlet_Code Sold_Units
0 2017-08-17 1132 AT 1
1 2017-08-18 1132 AT 1
2 2017-08-21 1132 AT 1
3 2017-08-22 1132 AT 1
4 2017-09-06 1132 AT 1
Тем не менее, как мне вменять пропущенные даты 19-го и 20-го и вложить строки с нулями под вновь добавленными строками даты?
Вот фрагмент того, что я сделалкоторый возвращает ошибку значения: не может переиндексировать с дублированной оси.