Я работаю над проблемой, когда мне нужно классифицировать фразы в одну из двух категорий (давайте А и В). Я использовал для этого модель Keras SepCNN (аналогично this ), и она дает мне некоторые результаты.
Теперь я хочу проанализировать прогнозы и более конкретно Я хочу знать, почему модель классифицировала определенную фразу в категории A или B, , набор функций которой сыграл важную роль в маркировке этой фразы как категории A или B?
Я не являюсь конечно, если это вообще возможно сделать, но нужны данные о том, как к этому приблизиться.
Структура модели для вашей справки
Векторизация текста (tfidf)
SelectKBest Features (используя scikit-learn feature_extraction)
Установите модель
Прогноз на тестовом наборе
Я посмотрел на inte rnet и не нашел ничего полезного. Было бы очень полезно, если бы кто-то указал мне верное направление. Я также исследовал библиотеку eli5, но она не работает для модели Keras SepCNN (по крайней мере, я не смог заставить ее работать, дайте мне знать, если кто-нибудь успешно ее использовал?)