ValueError: микросекунда должна быть в 0..999999 При попытке построения ряда с использованием точечной диаграммы - PullRequest
0 голосов
/ 01 мая 2020

Я получаю ValueError: microsecond must be in 0..999999, когда пытаюсь построить две серии, используя точечную диаграмму.

У меня есть два набора данных (содержит сообщения, сделанные на платформе с указанием времени их создания и количеством комментариев, полученных каждым сообщением) ) цель состоит в том, чтобы понять, в какое время, если пост был создан, он, вероятно, создаст большое количество комментариев.

hn_ask_sorted_data = hn_ask_data.sort_values(by = ['num_comments'],ascending=False)
hn_show_sorted_data = hn_show_data.sort_values(by = ['num_comments'],ascending=False)

hn_ask_sorted_data['created_at'] = pd.to_datetime(hn_ask_sorted_data['created_at'])
hn_show_sorted_data['created_at'] = pd.to_datetime(hn_show_sorted_data['created_at'])

Я преобразую столбец, содержащий время, в объект datetime, но меня больше интересует с компонентом времени объекта, следовательно, я беру только компонент времени, используя .dt.time

hn_ask_sorted_data['created_at'] = hn_ask_sorted_data['created_at'].dt.time
hn_show_sorted_data['created_at'] = hn_show_sorted_data['created_at'].dt.time

Затем я создаю диаграмму рассеяния, используя два столбца, один из которых содержит количество комментариев к сообщению и время, в течение которого сообщение было опубликовано (ie выше созданный столбец) вместо получения результатов я получаю описанную ошибку.

plt.scatter(hn_ask_sorted_data['created_at'],hn_ask_sorted_data['num_comments'])
plt.show()
plt.scatter(hn_show_sorted_data['created_at'],hn_show_sorted_data['num_comments'])
plt.show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...