Как заставить речь к тексту понимать буквы и цифры, а не слова - PullRequest
1 голос
/ 28 февраля 2020

При использовании google речи в текстовом API и произнесении строки символов, а не слов, Google пытается получить слова, поэтому, если я скажу: okyjtbrx, он транскрибирует это в порядке, почему Jay brtx. Есть ли способ заставить его понимать символы вместо слов?

1 Ответ

0 голосов
/ 29 февраля 2020

Вы не можете напрямую заставить его понимать это как строку символов; Тем не менее, вот два предложения, которым вы можете следовать, которые могут помочь получить желаемый результат:

Speech-to-Text API

Если вы используете Speech API напрямую, вы можете использовать речевую адаптацию в ваших запросах . Эта функция позволяет вам предоставить дополнительный контекст для вашего запроса на распознавание, давая фразы или классы, которые могут помочь распознаванию.

Для вашего конкретного c варианта использования вы должны взглянуть на $OOV_CLASS_ALPHANUMERIC_SEQUENCE, один из токены класса доступны для некоторых языков.

Эта опция сообщит модели, которую вы ожидаете в запросе, из последовательности букв [az] и цифр.

Dialogflow

Я добавляю эту опцию, потому что вы включили Dialogflow в теги вопроса. Если распознавание выполняется с помощью Dialogflow, то вы можете использовать regex сущностей, чтобы попытаться сопоставить намерение пользователя с шаблоном, определенным регулярным выражением.

...