Линия Участок в MathPlotLib, по частоте даты - PullRequest
0 голосов
/ 01 марта 2019

Итак, у меня есть данные в пандах, как показано ниже:

    date         max     min    rain    snow    ice
0   2019-01-01   58      39     0.06    0.0     0.0
1   2019-01-01   58      39     0.06    0.0     0.0
2   2019-01-01   58      39     0.06    0.0     0.0
3   2019-01-01   58      39     0.06    0.0     0.0
4   2019-01-01   58      39     0.06    0.0     0.0

Цель состоит в том, чтобы создать линейный график, который показывает на оси x максимальную температуру и на оси y частотукаждой даты для этой температуры.

Таким образом, в основном, список дат - это транзакции магазина, и я хочу увидеть влияние температуры на количество транзакций в день.

У меня естьпопытался использовать это, чтобы сгруппировать Weather_frame по дате, но я не могу заставить свой график показывать температуру по оси X.

max_temp = weather_frame.groupby(weather_frame.date).size()

Я прикрепил файл ниже.Мне пришлось удалить некоторые из них, чтобы не выходить за пределы размера для вставки, поэтому график может выглядеть поврежденным. Data Link

1 Ответ

0 голосов
/ 13 марта 2019
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

date_freq = weather_frame.groupby(weather_frame.date).size()
max_temp = weather_frame[['date', 'max']].groupby(weather_frame.date).mean()

sns.set()
plt.figure()
sns.regplot(x=max_temp, y=date_freq)
plt.xlabel('Maximum Temperature')
plt.ylabel('Number of Transactions per Day')

Max temperature vs transactions per day

Похоже, существует небольшая положительная зависимость между максимальной температурой и количеством транзакций в день.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...