Строительство пирога - PullRequest
2 голосов
/ 28 апреля 2019

Я пытаюсь составить круговую диаграмму категориальной переменной «Reclaim». В этой переменной 8 категорий. Я написал этот код:

 data.plot.pie(y='Reclaim', figsize=(5, 5))

Ошибка «TypeError:« <»не поддерживается между экземплярами« str »и« int »» Не могли бы вы объяснить, что здесь не поддерживается? В чем здесь проблема? Как int входит в игру, когда я имею дело только с категориями str? </p>

Вот паста из моего блокнота Jupyter:

> import pandas as pd
> data=pd.read_csv("reclaims1.txt")
> data.head()
> data.info()
<class 'pandas.core.frame.DataFrame'>
 RangeIndex: 122 entries, 0 to 121
 Data columns (total 3 columns): 
 Reclaim 122 non-null object
  Person 122 non-null object
  Processing time 122 non-null float64
 dtypes: float64(1), object(2)
 memory usage: 2.9+ KB
> import matplotlib.pyplot as plt
> import seaborn as sns
%matplotlib inline data.plot.pie(y='Reclaim', figsize=(5, 5))

Вот некоторые примеры данных:

       data['Reclaim'].head(5)
        0    Account closing
        1               IBAN
        2        Status info
        3           Matching
        4            Billing
        Name: Reclaim, dtype: object

Я бы хотел видеть процентную долю подтверждения, например, "IBAN" категория из набора данных на круговой диаграмме. Есть 8 категорий в Всего. Хотелось бы посмотреть, как часто они там представлены.

1 Ответ

1 голос
/ 28 апреля 2019

IIUC, я думаю, вам нужно Series.value_counts в первую очередь.Попробуйте:

data.Reclaim.value_counts().plot(kind='pie', figsize=(5, 5))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...