Даты сортировки и количество значений на заданную дату - PullRequest
1 голос
/ 14 мая 2019

Я пытаюсь отобразить график из фрейма данных:

    created_date    unique_key
0   2019    42065237
1   2011    22253407
2   2011    22254169

Для оси X я хочу, чтобы даты были отсортированы в порядке, для оси Y - общее количество уникальных ключей в год.

здесьвот что я пробовал:

plt.figure(figsize=(8,5))
x_data,y_data = (time_vs_heat_complaints_df['created_date'].values,time_vs_heat_complaints_df['unique_key'].values)
plt.plot(x_data,y_data, 'ro')
plt.xlabel('Year')
plt.ylabel('# of Heat/Hot Water Complaints')
plt.show()

это был мой результат, это беспорядок.

image

Для оси X я хочу, чтобы даты были отсортированы в порядке, для оси Y - общее количество уникальных ключей в год.и по какой-то причине он просто показывает от 1 до 4, он должен быть в сотнях тысяч (ось Y)

Мне конкретно нужно определить xdata и ydata, чтобы получить мои независимые и зависимые переменные для прогнозирования,ответ не работает в этом случае, потому что вот что я попытался использовать, используя его ответ:

plt.figure(figsize=(8,5))
x_data,y_data = (pluto_df['created_date'].values,pluto_df.groupby('created_date')['HEAT/HOT WATER'].size())
plt.plot(x_data,y_data, 'ro')
plt.xlabel('Year')
plt.ylabel('Complaints')
plt.show()

, и я получил ошибку

 x and y must have same first dimension, but have shapes (1289842,) and (9,)

1 Ответ

1 голос
/ 14 мая 2019

Попробуйте:

s = df.groupby('created_date').unique_key.size()
x_data, y_data = s.index, s.values

plt.plot(x_data, y_data)
plt.xlabel('Year')
plt.ylabel('# of Heat/Hot Water Complaints')
plt.show()

Вывод будет выглядеть так:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...