Я читаю CSV-файл с пандами, и после прочтения файла я хочу вычислить 2 вещи:
- Количество элементов
- % элементов
Например, если мои данные [X,X,Y,Z,Z,X,X,Y,Z,Y]
, я хочу, чтобы мой вывод был
X 4 40.0
Y 3 30.0
Z 3 30.0
Я попробовал следующее, но он выводит только суммы
train = pd.read_csv("./../input/train.csv")
grouped = train.groupby([x ,y]).size()
И это только вычисляет проценты:
train = pd.read_csv("./../input/train.csv")
grouped = grouped.groupby(level=[0]).apply(lambda x: x / x.sum())
Как я могу получить оба?