AWS Lex совпадает с неверным намерением, несмотря на ввод точного высказывания - PullRequest
2 голосов
/ 22 марта 2019

У меня была эта проблема во множестве разных случаев.

Я поделюсь примером одного.

У меня есть несколько часто задаваемых вопросов.Один из них отвечает «Что такое распознавание именованных сущностей»? Вот эти высказывания:

  1. Расскажите мне о распознавании именованных сущностей
  2. Расскажите мне о NER
  3. Что такое NER
  4. Что вы подразумеваете под Распознаванием именованных сущностей
  5. Что такое распознавание именованных сущностей

и другие ответы «Что такое оптическое распознавание символов?»Вот эти слова:

  1. OCR
  2. Что вы подразумеваете под OCR
  3. Можете ли вы сказать мне, что такое OCR
  4. Расскажите об OCR
  5. Что такое оптическое распознавание символов
  6. Что такое OCR

Когда я ввожу "Что такое ocr?"это работает как ожидалось и показывает ответ для OCR.Но когда я вместо этого ввожу OCR во всех заглавных буквах, с тем же самым точным вопросом (Что такое OCR?).Он переключается на намерение NER и показывает мне ответ «Что такое NER?»

Может кто-нибудь ответить, почему он это делает?и что более важно, что я делаю, чтобы заставить его работать как положено.

Имейте в виду, что это только один пример.Я встречался с этим и во многих других подобных сценариях.

Был также случай, когда намеренные высказывания, казалось, не совпадали даже отдаленно.Но он все равно переключился на неправильное намерение.

1 Ответ

3 голосов
/ 22 марта 2019

Согласно документации Lex и Alexa , аббревиатуры в пользовательских типах слотов должны быть написаны либо как одно слово со всеми заглавными буквами (OCR), либо как строчные буквы, разделенные точками и пробелами (ocr).

Внизу таблицы вы можете увидеть примеры для Fire HD7, Fire h. d., Fire HD и Fire HD 7, которые демонстрируют это - оба действительных параметра разрешат одно и то жеВывод значения слота.

Предполагая, что высказывания настроены в соответствии с передовой практикой, если вы предоставляете голосовой ввод, важно отметить, что высказывания чувствительны к таким вещам, как перегибы в вашем голосе, темп / интервал междуслова, акценты и многое другое.

Что касается немедленных шагов по повышению точности, вы всегда можете попытаться разбить свои намерения дальше, где вместо двух намерений у вас есть один для каждой перестановки значения пользовательского слота (NER, Распознавание именованных объектов, OCR и Оптическое распознавание символов).Людям легко понять, что первая буква фразы соответствует буквам в аббревиатуре, но когда дело доходит до обучения чат-бота, чтобы понять, что эти фразы являются синонимами, это немного сложнее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...