Question

У меня есть следующий фрейм данных:

pp  b          pp   b
5   0.001464    6   0.001853
5   0.001459    6   0.001843

Есть ли способ объединить столбцы с одинаковыми именами? Я просто хочу это как вывод:

pp  b         
5   0.001464    
5   0.001459    
6   0.001853
6   0.001843

Gustavo Mirapalheta · Answer 1 · 10 марта 2019

Я немного удивлен, что до сих пор никто не упомянул об использовании pd.concat ... Посмотрите ниже:

df1 = pd.DataFrame({'Col1':[1,2,3,4], 'Col2':[5,6,7,8]})
df1
      Col1  Col2
   0     1     5
   1     2     6
   2     3     7
   3     4     8

Теперь, если вы сделаете:

   df2 = pd.concat([df1,df1])

вы получите:

   Col1  Col2
0     1     5
1     2     6
2     3     7
3     4     8
0     1     5
1     2     6
2     3     7
3     4     8

Это то, что вы хотели, не так ли?

Scott Boston · Answer 2 · 29 апреля 2018

Давайте использовать расплав, cumcount и unstack:

dm = df.melt()
dm.set_index(['variable',dm.groupby('variable').cumcount()])\
  .sort_index()['value'].unstack(0)

Выход:

variable         b   pp
0         0.001464  5.0
1         0.001459  5.0
2         0.001853  6.0
3         0.001843  6.0

WeNYoBen · Answer 3 · 29 апреля 2018

Попробуйте groupby с осью = 1

df.groupby(df.columns.values, axis=1).agg(lambda x: x.values.tolist()).sum().apply(pd.Series).T.sort_values('pp')
Out[320]: 
          b   pp
0  0.001464  5.0
2  0.001459  5.0
1  0.001853  6.0
3  0.001843  6.0

Интересный способ с wide_to_long

s=pd.Series(df.columns)
df.columns=df.columns+s.groupby(s).cumcount().astype(str)

pd.wide_to_long(df.reset_index(),stubnames=['pp','b'],i='index',j='drop',suffix='\d+')
Out[342]: 
            pp         b
index drop              
0     0      5  0.001464
1     0      5  0.001459
0     1      6  0.001853
1     1      6  0.001843

jpp · Answer 4 · 29 апреля 2018

Это возможно, используя numpy:

res = pd.DataFrame({'pp': df['pp'].values.T.ravel(),
                    'b': df['b'].values.T.ravel()})

print(res)

          b  pp
0  0.001464   5
1  0.001459   5
2  0.001853   6
3  0.001843   6

Или без ссылки на конкретные столбцы:

res = pd.DataFrame({i: df[i].values.T.ravel() for i in set(df.columns)})

Объединение нескольких столбцов с одинаковыми именами в панде

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Объединение нескольких столбцов с одинаковыми именами в панде

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов