Допустим, у меня есть DataFrame
:
>>> df = pd.DataFrame({'a1':[1,2],'a2':[3,4],'b1':[5,6],'b2':[7,8],'c':[9,0]})
>>> df
a1 a2 b1 b2 c
0 1 3 5 7 9
1 2 4 6 8 0
>>>
И я хочу объединить (возможно, не объединить, а объединить) столбцы, в которых первая буква их имени равна, например a1
иa2
и другие ... но, как мы видим, есть столбец c
, который сам по себе не имеет других аналогичных столбцов, поэтому я хочу, чтобы они не выдавали ошибок, вместо этого добавляли к ним NaN
s.
Я хочу объединить таким образом, чтобы он превратил широкий DataFrame
в длинный DataFrame
, в основном, как широкий или длинный вариант.
У меня уже есть решение проблемы,но единственное, что это очень неэффективно, я хотел бы более эффективное и более быстрое решение (в отличие от моего: P), у меня в настоящее время есть цикл for
и код try
except
(тьфу, уже плохо звучит), такойкак:
>>> df2 = pd.DataFrame()
>>> for i in df.columns.str[:1].unique():
try:
df2[i] = df[[x for x in df.columns if x[:1] == i]].values.flatten()
except:
l = df[[x for x in df.columns if x[:1] == i]].values.flatten().tolist()
df2[i] = l + [pd.np.nan] * (len(df2) - len(l))
>>> df2
a b c
0 1 5 9.0
1 3 7 0.0
2 2 6 NaN
3 4 8 NaN
>>>
Я хотел бы получить те же результаты с лучшим кодом.