Вернуть распределение категориальных переменных в виде панд. - PullRequest
0 голосов
/ 05 июля 2018

У меня есть Pandas DataFrame с последним столбцом в качестве метки, категориальная переменная со значениями [0, 1], назовем ее df['label']. Фрейм данных выглядит следующим образом:

feat1   feat2...featn   label
.       .       .       0
.       .       .       1
.       .       .       .
.       .       .       1

Теперь мне нужно вернуть серию панд с именем sex длины 2 с этими целочисленными значениями и индексом = ['male', 'female']. До сих пор я застрял с использованием функции кросс-таблицы, но не могу получить необходимую серию.

pd.crosstab(index = df['label'], columns='count')

1 Ответ

0 голосов
/ 05 июля 2018

Без примера того, как выглядит ваш df, или изображения ожидаемого результата, я предполагаю, что функция value_counts () может быть тем, что вы ищете?

Click Here to view input

 import pandas as pd
df = pd.DataFrame({'Label_1':[0,1,1,1]})

df.Label_1.replace(to_replace=1, value='Male', inplace=True) 
df.Label_1.replace(to_replace=0, value='Female',inplace=True)


pd.DataFrame(df.Label_1.value_counts())

Click Here to view Output

Дайте мне знать, если это не так?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...