Я думаю, что ваш вопрос довольно широкий, потому что ваша проблема в основном связана с классификацией текста, и в литературе с ней сталкивались большинство алгоритмов классификации НЛП, так что вариантов гораздо больше (и, возможно, в вашем случае лучше), чем глубоких. учусь. Но если вы хотите использовать глубокое обучение, вам нужно учитывать не только архитектуру (простую многоуровневую, сверточную, LSTM и т. Д.), Но и объем помеченных данных, которые необходимы для хорошего обучения (а как насчет неконтролируемых алгоритмов для классификации текста? ).
Затем, независимо от выбранного вами подхода, я настоятельно рекомендую вам проверить алгоритмы встраивания слов (предварительно подготовленные или созданные с использованием ваших собственных данных), особенно те, которые похожи на fasttext , поскольку позволят вам заключать сделки с ошибочными словами .
Надеюсь, это поможет