Question

Я работаю с большим Python фреймом данных и замечаю, что некоторые столбцы имеют одинаковые значения для каждой строки НО имена столбцов разные. Кроме того, некоторые значения представляют собой текст или данные таймсерий.

Было ли проще избавиться от дубликатов этих столбцов и каждый раз сохранять их первыми?

Большое спасибо

Talha Anwar · Answer 1 · 13 июля 2020

Давайте создадим фиктивный фрейм данных, в котором два столбца с разными именами дублируются.

import pandas as pd
df=pd.DataFrame({
    'col1':[1,2,3,'b',5,6],
    'col2':[11,'a',13,14,15,16],
    'col3':[1,2,3,'b',5,6],
     
     })

    col1    col2    col3
0   1       11      1
1   2       a       2
2   3       13      3
3   b       14      b
4   5       15      5
5   6       16      6

Чтобы удалить повторяющиеся столбцы, сначала выполните транспонирование, затем примените drop_duplicate и снова выполните транспонирование

df.T.drop_duplicates().T

результат

    col1    col2
0   1       11
1   2       a
2   3       13
3   b       14
4   5       15
5   6       16

Удаление столбцов в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удаление столбцов в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы