Горизонтальная линейчатая диаграмма данных - PullRequest
1 голос
/ 20 января 2020

Я читаю данные пользователя movielens. Я хочу изобразить возраст и род занятий с разбивкой по полу (на двух отдельных участках). Но я получаю эту ошибку:

user_df.groupby(['gender'])['age'].unstack().plot.bar()

AttributeError: Невозможно получить доступ к вызываемому атрибуту 'unstack' объектов 'SeriesGroupBy', попробуйте использовать метод apply

I хотелось бы, чтобы график был похож на пример в http://benalexkeen.com/bar-charts-in-matplotlib/ Формат данных такой:

user_id age gender  occupation  zipcode
0   1   24  M   technician  85711
1   2   53  F   other   94043
2   3   23  M   writer  32067
3   4   24  M   technician  43537
4   5   33  F   other   15213

1 Ответ

1 голос
/ 20 января 2020

Вы можете попробовать что-то вроде этого:

df.groupby(['occupation'])['user_id'].nunique().plot.bar()

Для обоих пол и занятие Вы можете сделать:

df.groupby(['occupation','gender'])['user_id'].size().unstack().plot.bar()

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...