Google облако текст в речь молчание в начале и в конце сгенерированного mp3 - PullRequest
0 голосов
/ 24 апреля 2020

Мне нужно быстро воспроизвести несколько сгенерированных аудиофайлов из облачного текста Google в речевой сервис Вот что я получаю: https://yadi.sk/i/jbkGpd23bprmyw Как вы видите, в начале и в конце mp3-данных тишина составляет около 0,15-0,3 с. Есть ли способ сказать API не включать эти тихие части?

1 Ответ

0 голосов
/ 08 мая 2020

Вы можете использовать ffmpeg, чтобы извлечь часть аудиоклипа, которую вы хотите сохранить *1000*.

Например, если вы хотите, чтобы 0,5 секунды находились в середине 0,8 секундного клипа с 0,15 В начале и конце тишины вы устанавливаете -t 00:00:00.500 (длительность сохраняемого аудио) и используете параметр -ss 00:00:00.150 в начале, чтобы указать, с чего начать.

Полная команда будет выглядеть следующим образом:

ffmpeg -ss 00:00:00.150 -i ttsclip.mp3 -t 00:00:00.500 -acodec copy ttsclip-cut.mp3
...