Groupby не находит все идентификаторы - PullRequest
0 голосов
/ 09 ноября 2019

Groupby не находит все идентификаторы

  • Я извлек идентификаторы из URL-адреса
  • Поместить все в фрейм данных
  • , когда я группирую, он просто находит несколько идентификаторов
  • затем я добавил cw["campaignid"] = cw["campaignid"].str.replace(r'\ ', '') для удаления пробелов, даже при этом не находит идентификаторы

Кадр данных

cw=

campaignid    name    isb    

11            aaa     true
11            asa     false
11            afs     true
45            adfs    false
45            ads     true

моя попытка


cw["campaignid"] = cw["campaignid"].str.replace(r'\ ', '')

grouped_cw = cw.groupby(["campaignid"]).sum()

grouped_cw.rename(columns={'isb':'leads'}, inplace=True)

grouped_cw = pd.DataFrame(grouped_cw)

выход

campaignid    leads

11            2
45            2

желаемый выход

campaignid    leads

11            3
45            2

1 Ответ

1 голос
/ 09 ноября 2019

То, что вы хотите сделать, это получить количество записей на campaignid. Поэтому используйте .count() вместо .sum()

, см. Ниже:

grouped = cw.groupby(["campaignid"]).count()
grouped['leads'] = grouped['name']
grouped.drop(['name','isb'],axis=1, inplace=True)
print(grouped)

Это дает желаемый результат, который вы показали в своем посте.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...