Я использовал векторизатор tf-idf для решения проблемы и сохранил модель.
Теперь я хочу воспроизвести результаты в новом файле CSV и столкнулся со следующей проблемой:
Код:
Label=[]
for i in range(len(Desc)-1):
Label.append(model.predict(fitted_vectorizer.transform([Desc[i]])))
print(Label)
#df1['Label']=Label
И вот результат, который я получаю:
[array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Hardware'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Assembly-Part'], dtype=object), array(['Paint'], dtype=object)]
Для дополнительной информации список DES C содержит строки аналогичным образом:
['Damaged',
'Broken',
.
.
.
.
.
.
.
'Bad Paint']
Что могло пойти не так? Я хотел бы взять прогноз и заполнить его в столбце файла csv на следующем шаге.