У меня есть фрейм данных с большим количеством столбцов. Однако в этом вопросе я привел мини-версию df.
df = pd.DataFrame({'WT_IGL_x':[1,2,3,2,1,1,3,4,1,2], 'LA_WHN_x':[1,0,1,0,1,1,0,0,1,0], 'LA_WHN_y':[2,1,2,3,3,4,1,1,2,1], 'WT_IGL_y':[2,1,2,3,3,4,1,1,2,1], 'GT_OPP_IGL_x':[1,2,3,2,1,1,3,4,1,2], 'GT_OPP_IGL_y':[1,2,3,2,1,1,3,4,1,2]})
Я хочу вычесть два столбца с одинаковым префиксом и средней частью. В этом случае 1-й / 4-й столбцы и 2-й / 3-й столбцы и добавьте столбец с разницей и назовите их, добавив суффикс '_diff'
, поэтому мой желаемый результат будет:
df = pd.DataFrame({'WT_IGL_x':[1,2,3,2,1,1,3,4,1,2], 'LA_WHN_x':[1,0,1,0,1,1,0,0,1,0], 'LA_WHN_y':[2,1,2,3,3,4,1,1,2,1], 'WT_IGL_y':[2,1,2,3,3,4,1,1,2,1], 'WT_IGL_diff': [-1, 1, 1, -1, -2, -3, 2, 3, -1, 1], 'LA_WHN_diff': [-1, -1, -1, -3, -2, -3, -1, -1, -1, -1], GT_OPP_IGL_diff: [0,0,0,0,0,0,0,0,0,0]})
вычесть два столбца легко, но
- сопоставить два столбца с шаблонами
- добавить столбцы с отличиями
- автоматически присвоить имени столбцу суффикс '_diff'
тяжело.
Спасибо за вашу помощь.