У меня есть проект, использующий Google Speech to Text API на Android с потоковой реализацией.
Я столкнулся с проблемой, когда мне нужно оптимизировать пропускную способность, но я обнаружил неразрешимый конфликт между Android и Google.
Android только потоковые с методом AudioRecord
, который предоставляет несколько вариантов Encoding
, таких как Linear16
, AAC
, MP3
и DTS
.
Google рекомендует AMR_WB
, FLAC
или OGG_OPUS
для методов сжатия, но они недоступны с AudioRecord.AudioFormat
.
Есть ли способ передать аудио на API Google в сжатом формате, который Google поймет?
Я вижу два варианта решения, которые не могу найти:
- Найдите способ добавить опции кодирования в AudioRecord
- Найдите способ перекодировать аудиовыход между AudioRecord и Google
Пока что мне не повезло найти решение.