Pandas - количество всех уникальных комбинаций столбцов, включая строки с NONE - PullRequest
1 голос
/ 10 марта 2020

У меня есть следующий DataFrame:

      x_1   x_2     x_3     x_4        x_5    ID
0     159   xyz  883nne2  28h93  xx_lightz    10
1     159   xyz  883nne2  28h93  xx_lightz    10
2     159   xyz  883nne2  28h93        NaN    10
3     159   xyz  94mmm4k    NaN      heavy    15
4     159   xyz  94mmm4k    NaN      heavy    15
3     354   abc  94mmm4k    NaN        NaN     3    

Я хотел бы захватить все уникальные возможности на основе столбца ID и создать столбец подсчета, с выводом:

      x_1          x_2     x_3     x_4        x_5    ID  Count
0     159          xyz  883nne2  28h93  xx_lightz    10      2  
1     159          xyz  883nne2  28h93        NaN    10      1
2     159          xyz  94mmm4k    NaN      heavy    15      2
3     354          abc  94mmm4k    NaN        NaN     3      1

Опять же, конечная цель - взять все возможные комбинации, найденные в столбце с x_1 по x_5, и получить счет на основе столбца ID

Любое понимание очень ценится.

1 Ответ

0 голосов
/ 10 марта 2020

Вы должны заменить значение nan, потому что они будут исключены. См. документы . Вы можете попробовать это:

df.fillna('').groupby(df.columns.to_list()).size().reset_index().rename(columns={0:'count'})

   x_1  x_2      x_3    x_4        x_5  ID  count
0  159  xyz  883nne2  28h93             10      1
1  159  xyz  883nne2  28h93  xx_lightz  10      2
2  159  xyz  94mmm4k             heavy  15      2
3  354  abc  94mmm4k                     3      1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...