Удаление столбцов в Pandas - PullRequest
0 голосов
/ 13 июля 2020

Я работаю с большим Python фреймом данных и замечаю, что некоторые столбцы имеют одинаковые значения для каждой строки НО имена столбцов разные. Кроме того, некоторые значения представляют собой текст или данные таймсерий.

Было ли проще избавиться от дубликатов этих столбцов и каждый раз сохранять их первыми?

Большое спасибо

1 Ответ

1 голос
/ 13 июля 2020

Давайте создадим фиктивный фрейм данных, в котором два столбца с разными именами дублируются.

import pandas as pd
df=pd.DataFrame({
    'col1':[1,2,3,'b',5,6],
    'col2':[11,'a',13,14,15,16],
    'col3':[1,2,3,'b',5,6],
     
     })

    col1    col2    col3
0   1       11      1
1   2       a       2
2   3       13      3
3   b       14      b
4   5       15      5
5   6       16      6

Чтобы удалить повторяющиеся столбцы, сначала выполните транспонирование, затем примените drop_duplicate и снова выполните транспонирование

df.T.drop_duplicates().T

результат

    col1    col2
0   1       11
1   2       a
2   3       13
3   b       14
4   5       15
5   6       16
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...