Какие алгоритмы классификации текста я могу использовать для классификации сообщений чата клиента? - PullRequest
0 голосов
/ 04 мая 2018

Я работаю над тем, чтобы классифицировать сообщения чата клиентов по 5 категориям. Примеры категорий: «Логин», «SSL» и т. Д. В случае, если у клиента возникают проблемы с логином, сообщение может выглядеть примерно так: «У меня проблема с логином или мой логин не работает ... Мы должны принять во внимание». неправильное написание, упоминание нескольких классифицированных ключевых слов (например: я только что обновил свой SSL, но теперь у меня проблема с логином) и т. д.

Существуют ли модели / apis, которые я могу использовать для решения этой проблемы?

1 Ответ

0 голосов
/ 05 мая 2018

Я думаю, что ваш вопрос довольно широкий, потому что ваша проблема в основном связана с классификацией текста, и в литературе с ней сталкивались большинство алгоритмов классификации НЛП, так что вариантов гораздо больше (и, возможно, в вашем случае лучше), чем глубоких. учусь. Но если вы хотите использовать глубокое обучение, вам нужно учитывать не только архитектуру (простую многоуровневую, сверточную, LSTM и т. Д.), Но и объем помеченных данных, которые необходимы для хорошего обучения (а как насчет неконтролируемых алгоритмов для классификации текста? ).

Затем, независимо от выбранного вами подхода, я настоятельно рекомендую вам проверить алгоритмы встраивания слов (предварительно подготовленные или созданные с использованием ваших собственных данных), особенно те, которые похожи на fasttext , поскольку позволят вам заключать сделки с ошибочными словами .

Надеюсь, это поможет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...