У меня есть набор данных, который имеет следующие значения:
LabelA PositiveA NegativeA LabelB PositiveB NegativeB LabelC PositiveC NegativeC Final_Label
1 .60 .40 0 .30 .70 1 .9 .1 1
0 .1 .9 0 .49 .51 0 .3 .7 0
0 .34 .66 1 .87 .13 1 .90 .1 1
Final_label будет 1, если большинство Labels (LabelA, LabelB и Label C) будет 1 и наоборот.
Я хочу вычислить столбец под названием «Полярность», который имеет следующее определение:
- Если Final_label = 1, полярность является средним значением всех «PositiveA / B / C» чья метка была также 1
- Если Final_label = 0, полярность - это среднее значение всех "NegativeA / B / C", чья метка также была 0
Например, в Приведенный выше набор данных будет иметь следующее значение:
Polarity
.75 (adding and taking average of PositiveA and PositiveC)
.7033 (adding and taking average of NegativeA and Negativeb and NegativeC)
.885 (adding and taking average of PositiveB and PositiveC)
Как мне реализовать это в python? Здесь я показал 3 столбца, в моем наборе данных 7 столбцов Label.