Я пытаюсь непрерывно транслировать аудио с моей IP-камеры на сервер, на котором запущена функция deepspeech, для декодирования аудиопотока в текст в реальном времени с использованием FFMPEG.
Я использую следующую команду:
$ ffmpeg -i rtsp: //192.168.1.249: 8080 / h264_pcm.sdp -ar 16000 -ac 1 -acodec pcm_s16le -vn -f wav - |
deepspeech --model deepspeech-0.5.1-models / output_graph. pbmm --alphabet deepspeech-0.5.1-models / alphabet.txt --lm deepspeech-0.5.1-models / lm.binary --trie deepspeech-0.5.1-models / trie --audio -
Deepspeech: FileNotFoundError: [Errno 2] Нет такого файла или каталога: '-'
deepspeech не нравится спецификатор --audio -.
Есть ли способ достижениявышеуказанная цель с использованием этого подхода? Возможно, deepspeech просто не предназначен для этого?
Есть ли другие предложения относительно того, как этого можно достичь?
ffmpeg может быть направлен на запись файла .wav. Глубокая речь и перекодировать этот файл. Но я хочу постоянно транслировать и транскодировать аудио.