Как построить категориальную переменную на столбце даты в Python - PullRequest
2 голосов
/ 09 мая 2019

У меня есть данные, которые выглядят так

Date         Fruit
2017-01-01   Orange
2017-01-01   Apple
2017-01-08   Orange
2017-01-09   Orange
2017-01-09   Apple

Я хочу построить количество апельсинов, количество яблок по дате на одном графике. Как бы я это сделал?

Я сгруппировал их по дате и вижу результат.

df.groupby(['Date','Fruit']).size()
Date         Fruit
2017-01-01   Orange  1
             Apple   1
2017-01-08   Orange  1
2017-01-09   Orange  1
             Apple   1

Я пробовал это, но это дает гистограмму, имеющую две категории, но не против дат.

sns.catplot(x="Fruit", hue="Fruit", kind="count",
            palette="pastel", edgecolor=".6",
            data=df);

Как можно построить график с датой на оси X, количеством яблок и количеством апельсинов для каждой даты?

Ответы [ 2 ]

0 голосов
/ 23 мая 2019

Обрамление набора данных:

df = pd.DataFrame(columns=["Date", "Fruit"], data=[['2017-01-01','Orange'], ['2017-01-01','Orange'], ['2017-01-01','Apple'], ['2017-01-08','Orange'], ['2017-01-09','Orange'], ['2017-01-09','Apple']])

The data looks like this

Используя unstack и group by bar plot можно нарисовать:

(df
 .groupby(['Date', 'Fruit'])
 .size()
 .unstack()
 .plot.bar()
)

Here is the plot by date

0 голосов
/ 11 мая 2019

Вы можете сделать что-то вроде этого.

# dummy data
date_range = pd.date_range('2019-01-01', '2019-01-06', freq='D')
df = pd.DataFrame(['Orange', 'Apple', 'Orange', 'Orange',
                   'Apple', 'Apple', 'Apple', 'Orange', 'Orange'],
    index=[date_range[0], date_range[0], date_range[1], date_range[2],
           date_range[2], date_range[2], date_range[2], date_range[3],
           date_range[3]],
    columns=['Fruit'])
df.index.name = 'Date'

groupby, как вы, затем unstack, который выглядит следующим образом.

>>> print(df.unstack())

Fruit       Apple  Orange
Date                     
2019-01-01    1.0     1.0
2019-01-02    NaN     1.0
2019-01-03    3.0     1.0
2019-01-04    NaN     2.0

А затем выведите непакетированные данные.

df.unstack().plot(kind='bar')
plt.show()

enter image description here

(Вам, однако, придется что-то делать с форматированием даты).

...