Я пытаюсь создать многоклассовый классификатор текста, как объяснено здесь .Тем не менее, мой код ломается в строке:
NB_pipeline.fit(X_train, train[category])
Ниже приведена ошибка, которую я получаю:
File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
Я попытался выяснить, что возвращает train[category]
, и я получил то же самоеошибка.
1) X_train
- это dataframe
с одним столбцом и содержит отзывы клиентов.
2) train
- это dataframe
с двумя столбцами;В первом столбце содержится обзор клиента (аналогично X_train
), а во втором столбце - одна из 5 категорий (Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others
).
3) category
- одна из вышеупомянутых категорий.
Ниже приведен пример поезда dataframe
:
Index Feedback Category
0 While making payment got system error. System error
Staff behaviour was good at hotel
1 While making payment got system error. Staff Behaviour
Staff behaviour was good at hotel