Android Речевой текст очень чувствителен к фоновым шумам. Вариант использования - использовать преобразование речи в текст в области, где светлые фоновые шумы будут постоянными. Хотите контролировать распознавание речи только с определенными уровнями голоса.
Попробовал обойти, используя Среднеквадратическое значение и буферный ввод из Speech Recogniser . Некоторый обходной путь, использующий ту же логику, был бы полезен.
Обратные вызовы, возвращаемые из Android для распознавания речи:
override fun onReadyForSpeech(params: Bundle?) {
}
override fun onRmsChanged(rmsdB: Float) {
}
override fun onBufferReceived(buffer: ByteArray?) {
}
override fun onEvent(eventType: Int, params: Bundle?) {
}
override fun onBeginningOfSpeech() {
}
override fun onEndOfSpeech() {
}
override fun onError(error: Int) {
}
override fun onPartialResults(partialResults: Bundle?){
}
override fun onResults(results: Bundle?) {
}