У меня есть клиент, которому нужно приложение для Android, которое может распознавать голосовые команды.Из того, что я понимаю, встроенная функция передачи голоса в текст на самом деле отправляет данные на серверы Google, которые затем возвращают текстовый перевод.Это серьезная проблема, поскольку голосовые данные чрезвычайно чувствительны (если только данные не шифруются при отправке в Google и из Google - но я сомневаюсь, что они зашифрованы).
Есть 2 варианта, которые я могу придумать.Во-первых, это преобразование речи в текст на Android, хотя, похоже, это будет чрезвычайно дорогая операция.Вторая возможность заключается в том, чтобы локальный сервер преобразовывал данные для меня (я мог зашифровать голосовые данные и перевод при их отправке в и из).Это то, что CMU Sphinx может осуществить?Возможно, стоит отметить, что у меня также будет доступ к серверу Asterisk, который мог бы помочь с этим (я не знаю).
В действительности, должно быть только ~ 200 слов, которые понадобятся длябыть признанным.Я бы предпочел решения с открытым исходным кодом / бесплатное программное обеспечение, однако я также открыт для коммерческого решения (возможно, FlexT9).В идеале я могу отправить аудиопоток куда-нибудь, вернуть строку, которая является текстом, и затем я могу анализировать и выполнять другие операции со строкой.в прошлом, так что я надеюсь, что кто-то может, по крайней мере, указать мне правильное направление.Спасибо!