google-speech-api и распознавание телефонных номеров - PullRequest
0 голосов
/ 14 мая 2018

Кто-нибудь знает, есть ли способ манипулировать распознаванием телефонных номеров при использовании Google Speech API? Я пытаюсь реализовать сценарий транскрипции, когда вызывающий абонент скажет строку букв и цифр, но логика из коробки заключается в том, чтобы попытаться подогнать любую последовательность цифр к схеме телефонных номеров, даже если это означает рендеринг букв в числах они могут звучать неопределенно похожи (или нет). Я пытался использовать речевые контексты для манипулирования значениями в «телефонном номере», печатая и выдавая всю вещь, как и должно быть в качестве речевого контекста («восемь семь семь два пчела три семь», например), но он отказывается переопределить цифры, интерпретируемые как номер телефона. Кто-нибудь сталкивался с этой проблемой или знает, как это можно обойти?

Спасибо!

Ответы [ 2 ]

0 голосов
/ 10 августа 2018

По крайней мере, в одном случае установка языка en-PH (английский, Филиппины), похоже, устранила или, по крайней мере, заметно улучшила эту проблему.Другие варианты английского языка могут также работать.

ru возвращается как отформатированный номер в Великобритании, где сначала ставится одна цифра, а затем остальная часть.

0 голосов
/ 02 июня 2018

Я не знаю простого способа сделать это.Для API Web Speech для JavaScript выполнение следующих действий приводит к меньшему количеству результатов, которые принудительно переводятся в формат телефонного номера.второй предложенный результат, например,

constr speechToText = event.results[0][1].transcript

Вы можете получить довольно далеко, обработав результат.Еще одна проблема заключается в том, что, поскольку результат часто объединяет цифры, вы теряете различие между серией однозначных чисел и одним многозначным числом (например, «15» и «1», «5»).Полезность этого подхода зависит от специфики чисел, которые пытается захватить ваше приложение.

...