Question

Мне нужно быстро воспроизвести несколько сгенерированных аудиофайлов из облачного текста Google в речевой сервис Вот что я получаю: https://yadi.sk/i/jbkGpd23bprmyw Как вы видите, в начале и в конце mp3-данных тишина составляет около 0,15-0,3 с. Есть ли способ сказать API не включать эти тихие части?

SPDurkee · Answer 1 · 08 мая 2020

Вы можете использовать ffmpeg, чтобы извлечь часть аудиоклипа, которую вы хотите сохранить *1000*.

Например, если вы хотите, чтобы 0,5 секунды находились в середине 0,8 секундного клипа с 0,15 В начале и конце тишины вы устанавливаете -t 00:00:00.500 (длительность сохраняемого аудио) и используете параметр -ss 00:00:00.150 в начале, чтобы указать, с чего начать.

Полная команда будет выглядеть следующим образом:

ffmpeg -ss 00:00:00.150 -i ttsclip.mp3 -t 00:00:00.500 -acodec copy ttsclip-cut.mp3

Google облако текст в речь молчание в начале и в конце сгенерированного mp3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Google облако текст в речь молчание в начале и в конце сгенерированного mp3

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы