У меня есть веб-приложение на PHP, и я ищу реализацию высокоточного распознавания речи с открытым исходным кодом, которая будет принимать голосовые команды для открытия веб-страниц от пользователей.Примеры: « Сделать продажи » (откроется страница «Создать продажи PHP»), « Сделать заказ на покупку », « Открыть отчеты в конце дня »,и т.д.
Мой вопрос :
Я хочу знать, можем ли мы использовать Mozilla DeepSpeech для приема аудио .wav из браузера Firefox и возврата речи к тексту.Если да, каков будет процесс записи голоса из Firefox с помощью микрофона, чтобы преобразовать текст с помощью движка DeepSpeech?
Как сделать вызов пробуждения / запуска аналогичным OK-GOOGLE , который будет готов прослушивать команды?