Итак, в этой форме у меня есть датафрейм pandas, называемый year:
discharge (m^3/s)
date
2016-01-01 00:00:00 17.6930
2016-01-01 01:00:00 17.3247
2016-01-01 02:00:00 17.2436
2016-01-01 03:00:00 17.5696
2016-01-01 04:00:00 16.4074
2016-01-01 05:00:00 17.5696
2016-01-01 06:00:00 17.0420
....
2017-12-31 20:00:00 10.5911
2017-12-31 21:00:00 10.5620
2017-12-31 22:00:00 10.7374
2017-12-31 23:00:00 10.5620
Набор данных содержит данные о расходах за несколько лет, и я хочу сделать график, сравнивающий f.ex. январь месяц на 2016 и 2017 годы.
До сих пор я пытался извлечь нужные месяцы и просто нанести их друг на друга. Но это не работает, как вы можете видеть на этой картинке:
Попытка участка 1
Мой код для этого был:
# Comparison full months
def plotmonthdischarge(month, years, number_of_years):
df = pd.read_csv('resources\FinVannføringEidsfjordvatn.csv', encoding = 'ISO-8859-1',sep=';')
df['date'] = pd.to_datetime(df['date'],dayfirst=True)
df = df.set_index(df['date'])
df['Day Of Year'] = df['date'].dt.dayofyear
df = df.drop(['date'], axis = 1)
df = df.replace(to_replace='-9999', value = np.NaN)
fig, ax = plt.subplots()
# For a starting year 2016 and a 1 following year
# Call example:
# plotmonthdischarge(1,[2016],2)
if len(years) == 1:
start_year = years[0]
for i in range(number_of_years):
year = df['{0}-{1}-01 00:00:00'.format(start_year+i,month):'{0}-{1}-31 23:59:59'.format(start_year+i,month)]
ax.plot(year['discharge (m^3/s)'], label = 'Year {}'.format(start_year+i))
# Just for plotting(ignore)
formatted_list = ['{:>3}' for i in range(number_of_years)]
string_of_years = ', '.join(formatted_list).format(*[start_year+i for i in range(number_of_years)])
plt.title('Comparison plot of years {}'.format(string_of_years))
# Specific years 2006 and 2017
# Call example:
# plotmonthdischarge(1,[2006,2017],1)
if len(years) > 1:
number_of_years = 1
for item in years:
year = df['{0}-{1}-01 00:00:00'.format(item,month):'{0}-{1}-31 23:59:59'.format(item,month)]
ax.plot(year['Day Of Year'],year['discharge (m^3/s)'], label = 'Year {}'.format(item))
# Just for plotting(ignore)
formatted_list = ['{:>3}' for item in years]
string_of_years = ', '.join(formatted_list).format(*years)
plt.title('Comparison plot of years {}'.format(string_of_years))
print(year)
plt.suptitle(r'Discharge $m^{3}s^{-1}$')
plt.ylabel(r'Discharge $m^{3}s^{-1}$')
plt.legend()
plt.grid(True)
plotmonthdischarge(1,[2015,2016],1)
Моя следующая попытка была с чем-то, что я нашел в других сообщениях
df['Day Of Year'] = df['date'].dt.dayofyear
и затем построение графиков по всем дням месяца:
ax.plot(year['Day Of Year'],year['discharge (m^3/s)'], label = 'Year {}'.format(item))
Это сработало нормально, за исключением того, что кажется, что регистрируется только один или около того очков в день, что плохо, так как я работаю с почасовыми данными.
Попытка участка 2
Также попытался удалить год из даты и времени (мой индекс) и построить график над индексом даты и времени только с месяцем, днем и часами, но без реального успеха.
EDIT :
Пример графика того, как будет выглядеть график одного года (2015, январь).
Правильный сюжет я получаю только за один год