Есть ли какой-нибудь способ передачи ввода в глубинную речь под Linux? - PullRequest
0 голосов
/ 24 октября 2019

Я пытаюсь непрерывно транслировать аудио с моей IP-камеры на сервер, на котором запущена функция deepspeech, для декодирования аудиопотока в текст в реальном времени с использованием FFMPEG.

Я использую следующую команду:

$ ffmpeg -i rtsp: //192.168.1.249: 8080 / h264_pcm.sdp -ar 16000 -ac 1 -acodec pcm_s16le -vn -f wav - |
deepspeech --model deepspeech-0.5.1-models / output_graph. pbmm --alphabet deepspeech-0.5.1-models / alphabet.txt --lm deepspeech-0.5.1-models / lm.binary --trie deepspeech-0.5.1-models / trie --audio -

Deepspeech: FileNotFoundError: [Errno 2] Нет такого файла или каталога: '-'

deepspeech не нравится спецификатор --audio -.

Есть ли способ достижениявышеуказанная цель с использованием этого подхода? Возможно, deepspeech просто не предназначен для этого?

Есть ли другие предложения относительно того, как этого можно достичь?

ffmpeg может быть направлен на запись файла .wav. Глубокая речь и перекодировать этот файл. Но я хочу постоянно транслировать и транскодировать аудио.

...