Построение серии данных pandas с морским порогом - PullRequest
1 голос
/ 06 января 2020

Я новичок в Seaborn и Pandas

Мой DataFrame:

df

Search                      A       B       C       D           Language
Best TV for netflix         51      7.5     25.7    TV          en
Best TV for firestick       42      6.3     34.77   TV          es
TV cheap                    32      2.7     69.33   Cheap       en
Cheap TV                    44      14.7    74.14   Best        fr
...

Я учусь строить данные с seaborn.

Моя цель состоит в том, чтобы иметь возможность построить график:

  1. Количество вхождений на столбец, например, столбец или любой другой график, где значения будут value_counts() столбца
  2. Максимальные значения для столбца, например - максимальные значения столбцов A и B для категории Language
  3. Сумма столбца A для категория D

Должен ли я сначала выполнить вычисления, чтобы получить числа, которые мне нужны для графиков, или существуют более тонкие способы построения pandas кадров данных с seaborn в соответствии с документацией seaborn, сказано, что это было сделано для хорошей работы с pandas фреймами данных.

То, что я пробовал

count = df['Language'].value_counts()
head = count.head(5)
sns.barplot(x=head, y=count, data=df)
plt.show()

Что отображает топ-5 языковых категорий. Но я не знаю, как изобразить вторую и третью точку в моем разделе целей.

Спасибо за ваши предложения.

1 Ответ

1 голос
/ 06 января 2020

Максимальные значения для каждого языка:

grouped_data = df.groupby('Language')[['A', 'B']].max().reset_index()
sns.barplot(x='Language', y='A', data=grouped_data)

enter image description here

sns.barplot(x='Language', y='B', data=grouped_data)

enter image description here

Сумма столбца A по категории D:

sns.barplot(x='D', y='A', data=df.groupby('D').A.sum().reset_index())

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...