Выберите подмножество данных из пересечения двух наборов - PullRequest
0 голосов
/ 16 сентября 2018

У меня есть два набора заголовков столбцов из DataFrame. Один набор является подмножеством другого.

import pandas as pd
d = {'feature1':[1,2,3], 'feature2':[3,4,5], 'feature3':[6,7,8]}
df = pd.DataFrame(data=d)

теперь у меня два комплекта:

set_1 = {'feature1','feature2','feature3'}
set_2 = {'feature1','feature3'}

Как мне добиться, чтобы в моем (новом) Dataframe были выбраны только столбцы из подмножества?

1 Ответ

0 голосов
/ 17 сентября 2018

Наборы не могут быть хешируемыми, поэтому вам необходимо преобразовать их, например, в список.

Затем вы можете выбрать следующий кадр данных:

df[list(set_1)]

, который возвращает

    feature1    feature3    feature2
0   1   6   3
1   2   7   4
2   3   8   5

или

df[list(set_2)]

, что возвращает

    feature1    feature3
0   1   6
1   2   7
2   3   8
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...