Я довольно новичок в python, особенно в библиотеках данных, поэтому прошу прощения за любой идиотизм.
Я пытаюсь попрактиковаться с составленным набором данных ежемесячных наблюдений за 12 месяцев, данные выглядят такэто ...
print(data)
2017-04-17 156
2017-05-09 216
2017-06-11 300
2017-07-29 184
2017-08-31 162
2017-09-24 91
2017-10-15 225
2017-11-03 245
2017-12-26 492
2018-01-26 485
2018-02-18 401
2018-03-09 215
2018-04-30 258
Эти ежемесячные наблюдения являются нерегулярными (есть ровно один в каждом месяце, но далеко не в одно и то же время).
Теперь я хочу использовать линейную интерполяцию для получения значений в начале каждого месяца -
Я перепробовал несколько методов ... и смог сделать это «вручную»', но я пытаюсь справиться с пандами и numpy, и я знаю, что это можно сделать с этим, вот что у меня было до сих пор: я делаю серию, содержащую данные, а затем я делаю:
resampled1 = data.resample('MS')
interp1 = resampled1.interpolate()
print(interp1)
Это печатает:
2017-04-01 NaN
2017-05-01 NaN
2017-06-01 NaN
2017-07-01 NaN
2017-08-01 NaN
2017-09-01 NaN
2017-10-01 NaN
2017-11-01 NaN
2017-12-01 NaN
2018-01-01 NaN
2018-02-01 NaN
2018-03-01 NaN
2018-04-01 NaN
Теперь я знаю, что первый 2017-4-17 должен быть NaN, так как линейная интерполяция (которую я считаю по умолчанию), интерполирует между двумя точками дои после ... что невозможно, так как у меня нет назначения до 1 апреля.Что касается других ... Я не уверен, что я делаю неправильно ... вероятно, только потому, что я изо всех сил пытаюсь обернуть свою голову точно, что делает повторная выборка?