Подсчитать категориальные значения в DataFrame - PullRequest
0 голосов
/ 27 декабря 2018

У меня есть DataFrame только с категориальными значениями

    Col1 | Col2| ... | ColM
Row
 1   X   |  Y  | ... |  X
 2   Z   |  X  | ... |  Y
 3   Y   |  Z  | ... |  X
 .
 .
 .
 N   X  |   Z  | ... | Z

Я хотел бы посчитать, сколько раз каждая категория появилась в базе данных. Пример результата:

X - 100 times
Y - 30 times
Z = 210 times

Спасибо за помощь

1 Ответ

0 голосов
/ 27 декабря 2018

Наиболее эффективный вариант - использовать np.unique с установленным флагом return_counts:

u, c = np.unique(df, return_counts=True)
pd.Series(c, index=u)

Также есть stack и value_counts, что намного медленнее, но просто и интуитивно понятно:

df.stack().value_counts()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...