Мультиклассовая классификация текста в Python - PullRequest
0 голосов
/ 04 октября 2018

Я пытаюсь создать многоклассовый классификатор текста, как объяснено здесь .Тем не менее, мой код ломается в строке:

NB_pipeline.fit(X_train, train[category])

Ниже приведена ошибка, которую я получаю:

File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)

Я попытался выяснить, что возвращает train[category], и я получил то же самоеошибка.

1) X_train - это dataframe с одним столбцом и содержит отзывы клиентов.

2) train - это dataframe с двумя столбцами;В первом столбце содержится обзор клиента (аналогично X_train), а во втором столбце - одна из 5 категорий (Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others).

3) category - одна из вышеупомянутых категорий.

Ниже приведен пример поезда dataframe:

Index           Feedback                                    Category
  0           While making payment got system error.         System error
              Staff behaviour was good at hotel

  1           While making payment got system error.         Staff Behaviour
              Staff behaviour was good at hotel

1 Ответ

0 голосов
/ 08 октября 2018

Это одна из самых недооцененных проблем.

Причина этой ошибки заключается в том, что искомый сценарий «столбец» недоступен в кадре данных.Все 5 категорий, которые у вас есть, должны быть столбцами во входном фрейме данных, и строки будут занимать 1/0, если одна из категорий применима для обратной связи / комментария.В идеале ваш входной фрейм данных должен выглядеть следующим образом.

Index           Feedback                                  System error    Staff Behaviour
  0           While making payment got system error.         1                  1
              Staff behaviour was good at hotel

  1           While making payment got system error.         1                  0

  2           Staff behaviour was good at hotel              0                  1

Я использовал тот же комментарий, чтобы показать, как должен выглядеть входной фрейм данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...