У меня есть DataFrame с именем a
, который может быть показан следующим образом.
import pandas as pd
a=pd.DataFrame({'id':[1,2,3],'label 0':[0.2,0.4,0.5],
'label 1':[0.3,0.2,0.1],'label 2':[0.5,0.4,0.4]})
Input:
id label 0 label 1 label 2
0 1 0.2 0.3 0.5
1 2 0.4 0.2 0.4
2 3 0.5 0.1 0.4
Каждая строка содержит вероятность того, что каждый id
принадлежит трем меткам, где три метки label 0
, label 1
, label 2
.Теперь я хочу использовать label
с наибольшей вероятностью, имя столбца, в качестве прогнозируемого значения id
.Если есть две метки с наибольшей вероятностью, возьмите одну из них.
Expected:
id predict
0 1 label 2
1 2 label 0
2 3 label 0
Заранее спасибо!