Мне нужна помощь здесь. Я пытаюсь изменить один столбец в моем файле .csv, некоторые из которых пусты, а некоторые со списком категорий. Как следует:
tdaa_matParent,tdaa_matParentQty
[],[]
[],[]
[],[]
[BCA_Aluminum],[1.3458]
[BCA_Aluminum],[1.3458]
[BCA_Aluminum],[1.3458]
[BCA_Aluminum],[1.3458]
[],[]
[Dye Penetrant Solution, BCA_Aluminum],[0.002118882, 1.3458]
Но до сих пор мне удалось только преобразовать в двоичную форму первый столбец (tdaa_matParent), но я не смог заменить 1-е на соответствующее им значение количества, как это.
s = materials['tdaa_matParent']
mlb = MultiLabelBinarizer()
df = pd.DataFrame(mlb.fit_transform(s),columns=mlb.classes_)
BCA_Aluminum,Dye Penetrant Solution,tdaa_matParentQty
0,0,[]
0,0,[]
0,0,[]
1,0,[1.3458,0]
1,0,[1.3458,0]
1,0,[1.3458,0]
1,0,[1.3458,0]
0,0,[]
1,1,[1.3458,0.002118882]
Но что я действительно хочу, так это новый набор столбцов для каждой категории столбцов (то есть BCA_Aluminium и Dye Penetrant Solution). Также каждый столбец, если он заполнен, должен быть заменен значением второго столбца (tdaa_matParentQty).
Например:
BCA_Aluminum,Dye Penetrant Solution
0,0
0,0
0,0
1.3458,0
1.3458,0
1.3458,0
1.3458,0
0,0
1.3458,0.002118882