Я получаю ValueError: microsecond must be in 0..999999
, когда пытаюсь построить две серии, используя точечную диаграмму.
У меня есть два набора данных (содержит сообщения, сделанные на платформе с указанием времени их создания и количеством комментариев, полученных каждым сообщением) ) цель состоит в том, чтобы понять, в какое время, если пост был создан, он, вероятно, создаст большое количество комментариев.
hn_ask_sorted_data = hn_ask_data.sort_values(by = ['num_comments'],ascending=False)
hn_show_sorted_data = hn_show_data.sort_values(by = ['num_comments'],ascending=False)
hn_ask_sorted_data['created_at'] = pd.to_datetime(hn_ask_sorted_data['created_at'])
hn_show_sorted_data['created_at'] = pd.to_datetime(hn_show_sorted_data['created_at'])
Я преобразую столбец, содержащий время, в объект datetime, но меня больше интересует с компонентом времени объекта, следовательно, я беру только компонент времени, используя .dt.time
hn_ask_sorted_data['created_at'] = hn_ask_sorted_data['created_at'].dt.time
hn_show_sorted_data['created_at'] = hn_show_sorted_data['created_at'].dt.time
Затем я создаю диаграмму рассеяния, используя два столбца, один из которых содержит количество комментариев к сообщению и время, в течение которого сообщение было опубликовано (ie выше созданный столбец) вместо получения результатов я получаю описанную ошибку.
plt.scatter(hn_ask_sorted_data['created_at'],hn_ask_sorted_data['num_comments'])
plt.show()
plt.scatter(hn_show_sorted_data['created_at'],hn_show_sorted_data['num_comments'])
plt.show()