Подсчитать определенное поле в группе данных - PullRequest
0 голосов
/ 11 октября 2018

Я новичок в Python и пытаюсь понять, как манипулировать кадрами данных Pandas.Я использую набор данных winemag-data-130k-v2.csv.Области интересов: «страна», «провинция», «винодельческое хозяйство».

Первое, что я хотел бы сделать, это определить количество винодельческих предприятий на провинцию.Я могу добраться до reviews_df.groupby(['country','province']).size()

Но это дает мне количество строк.(Итак, 3, если винодельня производит 3 сорта).Но я хочу что-то вроде count(distinct winery) в SQL.Предложения?

1 Ответ

0 голосов
/ 11 октября 2018

Что вам нужно, это nunique () :

reviews_df.groupby(['country','province']).nunique()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...