API или SDK для распознавания речи только по номерам (от 1 до 10000)? - PullRequest
2 голосов
/ 05 апреля 2019

Мне нужно специализированное решение, оптимизированное для обнаружения чисел от 1 до 1000, которое будет использоваться на смартфоне.Лучшим решением было бы иметь этот SDK, работающий в автономном режиме.Любая идея ?Я не нахожу конфигурацию с Google Speech или Amazon Transcribe, чтобы разрешить "только номер"

1 Ответ

1 голос
/ 05 апреля 2019

Не совсем правильно ожидать чисел от людей, они обычно говорят много вещей, таких как «я не знаю» или «немного подождать», даже если вы попросите у них цифры.Вы нанесете существенный вред этому опыту.

Вам необходимо разумно анализировать результат распознавания, и даже если распознается не число, вы должны действовать соответствующим образом.

Чтобы повысить точность специально используемых чисел, вы можете использовать функция подсказки слов Google Speech API.Просто добавьте цифры и другие необходимые слова в качестве подсказки, и Google распознает их намного точнее.У Amazon также есть эта функция, которую они называют « пользовательский словарь ».

Если вы хотите использовать автономный API, вы можете попробовать Kaldi .Вы можете адаптировать словарь Калди с числами для повышения точности, это будет намного лучше, чем Google API.

...