В настоящее время я делаю голосовой ассистент и сталкиваюсь со следующей проблемой:
Обнаружение голоса в Google Dialogflow серьезно подкрепляет мои цифры c, введенные в ассистент. Например, когда я произнесу однозначное «Один девять, восемь, семь, два, три», это превратит его в 987 или 1987 год. Кажется, что это просто отключает слушание и сразу же продолжается, когда он думает, что у него полная сущность.
Я создал собственную составную сущность, которая построена из трех разных шаблонов распознавания.
- @sys.number-integer: число-целое
- NumberRegex ^ ([1-9] {1} ([0-9]) {1,4} [0-9] {1}) $
- NumberCardinals @ sys.cardinal: кардинал (повторяется 3-6 раз как составная сущность)
В основном я хочу обнаружить числовой вход c, состоящий из 3 чисел минимум и 6 максимум. Набор текста отлично работает, он безошибочно определяет все комбинации, будь то кардиналы или числа ...
Но речь - это просто огромная проблема, и она прерывается до того, как пользователь заканчивает говорить.
Кто-нибудь получил какие-либо предложения о том, как преодолеть это? И заставить DialogFlow прослушивать максимальное количество номеров?