Какой самый эффективный способ реализовать автономный распознаватель непрерывной речи на Android с помощью Tensorflow? - PullRequest
0 голосов
/ 22 сентября 2019

Я ищу способ реализовать автономный распознаватель непрерывной речи, работающий на Android и предпочтительно с использованием механизма Tensorflow.

Приложение должно иметь возможность распознавать любое слово из предопределенного набора словВ непрерывном потоке речи предполагается, что устройство Android может находиться в области, которая не поддерживает подключение к Интернету, поэтому об услугах Google и подобных вещах не может быть и речи.

Возможно, есть какие-либо RNN илиМодели CNN, которые могут достичь этого?

1 Ответ

1 голос
/ 22 сентября 2019

Вы можете использовать модель Распознавание речи (прокрутите вниз и найти « Распознавание речи »), доступную на TensorFlow Lite .Он может генерировать оценки вероятности для слов, произнесенных в аудиопотоке.Лучше всего то, что они предоставили образец Android здесь .

Используя модель TensorFlow Lite, вам не потребуется активное подключение к Интернету для прогнозирования.Это может повлиять на размер приложения (хотя файл модели .tflite может иметь большой размер).

Вы можете создать простой метод, который извлекает необходимые слова из предсказаний модели.

...