Rasa.Неверный показатель достоверности для не связанных сообщений - PullRequest
0 голосов
/ 07 февраля 2019

Я создаю бота, используя rasa для ответа на вопросы пользователя, и у меня есть проблема.

Rasa дает мне высокий уровень доверия к сообщениям, которые совершенно не связаны с примерами намерений.

У меня есть медицинские намерения, но такие сообщения, как «Я люблю кофе», дают мне больше уверенности, чем связанные с ними сообщения.Кроме того, сообщения случайных символов типа «laj jfias jjlas fe» также дают мне высокую уверенность.

Может ли кто-нибудь дать мне подсказку, как это исправить?Где я могу найти ошибку?

Это мой конфиг:

language: "en"

pipeline:
- name: "nlp_spacy"
- name: "tokenizer_spacy"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_spacy"
- name: "ner_crf"
- name: "ner_synonyms"
- name: "intent_classifier_sklearn"

1 Ответ

0 голосов
/ 08 февраля 2019

Кажется, проблема в принудительной классификации в одном из ваших намерений.Один из способов ее решения может быть следующим:

  1. Добавьте несколько примеров, не связанных с вашим доменом, и добавьте их по какому-либо назначению, например your_fallback_intent

  2. Определите историю для your_fallback_intent

. Это приведет к тому, что nlu будет классифицировать несвязанные сообщения в your_fallback_intent

. Просьба добавить подробности в комментарии, если вы все еще сталкиваетесь свыпуск.

...