Panda: отфильтровать данные по категориям - PullRequest
0 голосов
/ 21 октября 2018

У меня есть набор данных, как показано ниже:

X, Y
yes, 1
No, 2
Yes, 3
Yes, 4
No, 2
No, 1
Yes, 0
No, 4
No, 4
No, 5

Я хочу получить из него следующий вывод:

X: { Yes, No}
y: {[1, 3, 4, 0], [2, 2, 1, 4, 4, 5]}

Как мне добиться с помощью Python?

РЕДАКТИРОВАТЬ : Я новичок в библиотеке panda, работаю как часть моего проекта по науке о данных.Как мне добиться этого, используя словарь panda ... кто-нибудь может привести пример с предоставленным мною набором данных?

1 Ответ

0 голосов
/ 21 октября 2018

Вы можете использовать метод панд groupby со списком, который будет выполнять Джоб как ниже:

>>> df
     X  Y
0  Yes  1
1   No  2
2  Yes  3
3  Yes  4
4   No  2
5   No  1
6  Yes  0
7   No  4
8   No  4
9   No  5

>>> {k: v["Y"].tolist() for k,v in df.groupby("X")}
{'No': [2, 2, 1, 4, 4, 5], 'Yes': [1, 3, 4, 0]}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...