Использование преимуществ формата аудио при потоковой передаче с помощью Google Speech to Text - PullRequest
0 голосов
/ 15 января 2019

У меня есть проект, использующий Google Speech to Text API на Android с потоковой реализацией.

Я столкнулся с проблемой, когда мне нужно оптимизировать пропускную способность, но я обнаружил неразрешимый конфликт между Android и Google.

Android только потоковые с методом AudioRecord, который предоставляет несколько вариантов Encoding, таких как Linear16, AAC, MP3 и DTS.

Google рекомендует AMR_WB, FLAC или OGG_OPUS для методов сжатия, но они недоступны с AudioRecord.AudioFormat.

Есть ли способ передать аудио на API Google в сжатом формате, который Google поймет?

Я вижу два варианта решения, которые не могу найти:

  • Найдите способ добавить опции кодирования в AudioRecord
  • Найдите способ перекодировать аудиовыход между AudioRecord и Google

Пока что мне не повезло найти решение.

...