Как удалить столбцы, где среднее значение столбца уже существует - PullRequest
0 голосов
/ 03 мая 2018

В приведенном ниже примере столбец C следует удалить, поскольку он уже существует (столбец A должен остаться)

тип (df): pandas.core.frame.DataFrame

A B C

1 2 1

0 2 0

3 2 3

Я пытался создать словарь для последующего удаления повторяющихся значений, но застрял

dict_test = {}

for each_column in df:
    dict_test[each_column] = df[[each_column]].mean()

dict_test

Результат оказался dtype: float64, 'A': A 1.33333

Проблема выше в том, что в словаре хранится «Ключ и значение» в разделе «Значение», поэтому я не могу сравнивать значения друг с другом

1 Ответ

0 голосов
/ 03 мая 2018

Вы можете использовать df.mean().drop_duplicates() и индексирование панд:

In [30]: df[df.mean().drop_duplicates().index]
Out[30]:
   A  B
0  1  2
1  0  2
2  3  2
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...