Я пытаюсь сравнить данные за 10 лет. Я хотел бы удалить «год» из даты и времени, чтобы я мог строить каждый январь поверх друг друга.
Я пробовал следующее
df_data = pd.read_csv("P11-B2.csv", skiprows=[i for i in range(1,35)], usecols=[1,2,4])
df = pd.DataFrame(columns = ['Datetime', 'FH'])
df1 = pd.to_datetime(df_data['YYYYMMDD'], format='%Y%m%d')
df2 = df_data[' HH'].astype('timedelta64[h]')
df['Datetime'] = df1 + df2
df['FH'] = pd.to_numeric(df_data[' FH'], errors ='coerce')
del df1
del df2
del df_data
df['month'] = pd.DatetimeIndex(df['Datetime']).month
df100 = pd.to_datetime(df['month'], format='%m')
df['day'] = pd.DatetimeIndex(df['Datetime']).day
df101 = pd.to_datetime(df['day'], format='%d')
df['hour'] = pd.DatetimeIndex(df['Datetime']).hour
df102 = df['hour'].astype('timedelta64[h]')
df['year'] = 1900
df104 = pd.to_datetime(df['year'], format='%Y')
#df['DATE'] = df104 + df100 + df101 + df102
df['DATE'] = df['year'] + df['month'] + df['day'] + df['hour']
Хотя это возвращает целое число.
Есть ли другой способ только удалить год и сохранить формат %m%d%H
? Или есть простой способ переопределить ось х и использовать целое число?
Это то, что я хотел бы построить
Я хочу сделать график для каждый месяц, показывая разные строки для каждого года.