Я нашел много вопросов, похожих на мои, но ни один из них точно не ответил ( этот ближе всего подходит, но он фокусируется на рубине).
У меня есть пандас DataFrame, подобный этому:
import pandas as pd
import numpy as np
df = pd.DataFrame({'Date': pd.date_range('2014-10-03', '2015-10-02', freq='1D'), 'Variable': np.random.randn(365)})
df.head()
Out[272]:
Date Variable
0 2014-10-03 0.637167
1 2014-10-04 0.562135
2 2014-10-05 -1.069769
3 2014-10-06 0.556997
4 2014-10-07 0.253468
Я хочу отсортировать данные с 1 января по 31 декабря, игнорируя компонент года столбца Date
.Предпосылкой является то, что я хочу отслеживать изменения в Variable
за год, но мой период начинается и заканчивается в октябре.
Я подумал о создании отдельного столбца для месяца и года, а затем сортировать по ним.Но я не уверен, как это сделать «правильно» и кратко.
Ожидаемый результат:
Date Variable
0 01-01 0.637167 # (Placeholder-values)
1 01-02 0.562135
2 01-03 -1.069769
3 01-04 0.556997
4 01-05 0.253468