Поправка:
Если у меня есть пандас DataFrame, который содержит 5 столбцов Col1
& Col2
& Col3
& Col4
& Col5
, и мне нужно получить максимальный коэффициент корреляции Пирсона между (Col2
, Col3
) & (Col2
, Col4
) & (Col2
, Col5
), учитывая значения в Col1
Измененные значения для Col2
, полученные по следующей формуле:
df['Col1']=np.power((df['Col1']),B)
df['Col2']=df['Col2']*df['Col1']
, где B
- изменяющаяся переменная (одно значение), чтобы получить максимальный коэффициент корреляции Пирсона между (новые значения Col2
, Col3
) & (новые значения Col2
, Col4
) & ( новые значения Col2
, Col5
).
Обновление:
В приведенной выше таблице, содержащей 5 столбцов, как я упоминал выше, показана взаимосвязь между коэффициентами между (Col2
, Col3
) и (Col2
, Col4
) & (Col2
, Col5
) под столом.
Мне нужно изменить значения Col2
на основе двух упомянутых уравнений, где изменяющееся значение равно B
.
Итак, вопрос в том, как получить наилучшее значение B
, которое дает новый коэффициент корреляции, больший или равный его аналогу (старому)?
Обновление 2:
Col1, Col2, Col3, COL4, Col5
2,0.051361397,2618,1453,1099
4,0.053507779,306,153,150
2,0.041236151,39,54,34
6,0.094526419,2755,2209,1947
4,0.079773397,2313,1261,1022
4,0.083891415,3528,2502,2029
6,0.090737243,3594,2781,2508
2,0.069552772,370,234,246
2,0.052401789,690,402,280
2,0.039930675,1218,846,631
4,0.065952096,1706,523,453
2,0.053064126,314,197,123
6,0.076847486,4019,1675,1452
2,0.044881545,604,402,356
2,0.073102611,2214,1263,1050
0,0.046998526,938,648,572