Подмножество кадра данных в pandas в соответствии со значениями имени столбца - PullRequest
2 голосов
/ 30 апреля 2020

У меня есть датафрейм в pandas, который мне нужно разделить. Это намного больше, чем это, но вот пример:

ID A  B

a   0  0

b   1  1 

c   2  2

, и у меня есть список: keep_list = ['ID','A'] и другой список: recode_list = ['ID','B']

Я хотел бы разделить фрейм данных, поднятый заголовками столбцов, на два фрейма данных: один фрейм данных с теми столбцами и значениями, заголовки столбцов которых соответствуют keep_list, и один с теми заголовками столбцов и данными, которые соответствуют списку recode_alleles. Каждый код, который я пробовал до сих пор, не работал, поскольку он пытается сравнить значения со списком, а не с именами столбцов.

Заранее большое спасибо за вашу помощь!

Ответы [ 2 ]

1 голос
/ 30 апреля 2020

Вы можете сделать это с помощью index.intersection:

df1 = df[df.columns.intersection(keep_list)]
df2 = df[df.columns.intersection(recode_list)]
1 голос
/ 30 апреля 2020

Предполагая, что имя вашего DataFrame - df:

, вы можете просто сделать df[keep_list] и df[recode_list], чтобы получить то, что вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...