У меня есть panda dataframe
, который содержит мультииндекс и несколько столбцов.
Я хочу добавить новые столбцы в этот dataframe
, сложив (вычтя) вместе 2 или более существующих столбцов в dataframe
.
Что такое имена новых столбцов, какие столбцы следует использовать, и нужно ли их добавлять или вычитать, задается в отдельном входном файле csv
.
Например:
my исходный фрейм данных :
col1 col2 col3 col4
index1 index2
A X 10 100 50 20
B X 10 200 50 20
C X 10 300 50 20
инструкция столбца csv / dataframe
Factor
newCol existingCol
newCol1 col1 1
newCol1 col2 1
newCol2 col2 1
newCol2 col3 -1
newCol2 col4 -1
Этот файл говорит о создании 2 новых столбцов с именами newCol1
и newCol2
. Чтобы сделать newCol1
, добавьте данные в col1
и col2
. Чтобы сделать newCol2
, возьмите данные в col2
и вычтите col3
и col4
.
Чистый результирующий кадр данных должен выглядеть следующим образом:
col1 col2 col3 col4 newCol1 newCol2
index1 index2
A X 10 100 50 20 110 30
B X 10 200 50 20 210 130
C X 10 300 50 20 310 230
Я не знаю, прежде чем читать данные и файлы столбцов, как будут называться имена столбцов или как их объединять.
Если dataframe
должно быть "deindexed"
, чтобы сделать это нормально, я всегда могу переиндексировать его снова после добавления новых данных столбца.
Вся помощь приветствуется.