Как удалить тишину из аудиофайла, оставив при этом немного удаленной части? - PullRequest
0 голосов
/ 24 февраля 2020

Извините за заголовок, это немного сложно объяснить кратко!

У меня есть куча коротких (1-4) записей людей, читающих предложения. Они были записаны сами. Часто в начале или в конце возникает некоторое молчание, и я хотел бы автоматизировать его удаление.

В качестве первого прохода я использовал эту команду:

sox original.mp3 edited.mp3 silence 1 0.1 2% reverse silence 1 0.1 2% reverse

Проблема в том, что когда люди говорят, иногда самое начало их речи тихое и быстро нарастает. Таким образом, эта команда обрезает самое начало ряда предложений.

Итак, я хотел бы сделать то же самое, что и команда sox, но в идеале, когда она обнаруживает границу, она оставляет 50 мс до границы, признавая, что могут быть некоторые тихие, но важные звуки.

Я думаю, что ffmpeg мог бы быть хорошим инструментом для этого, так как я не думаю, что sox можно настроить таким образом. Я инструмент агности c. Хотя я вообще не знаю ffmpeg, поэтому я ценю любую помощь в составлении команды с довольно загадочным синтаксисом ffmpeg!

Еще один приятный момент, который есть над вышеупомянутой командой sox, - это только удалить тишину в начале и конец (если он существует) - не с середины записи.

ОБНОВЛЕНИЕ: исходя из времени, проведенного с ffmpeg, похоже, что я хочу что-то вроде этого

ffmpeg -i input.mp3 -af "silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak,areverse,silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak,areverse" output.mp3

Странно это искажено. Я подумал, что он не работает должным образом, но когда я пытаюсь сделать что-то вроде

ffmpeg -i input.mp3 -af areverse output.mp3

Это не работает - я просто возвращаю ввод. Я не уверен, что происходит не так?

Если я просто начну,

ffmpeg -i input.mp3 -af "silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak" output.mp3

Это отлично работает - для начала. Но не уверен, почему обратный трюк приводит к искаженному выводу.

UPDATE2: на самом деле похоже, что команда работает, но он меняет метаданные таким образом, что делает itunes выигрышным. Если я использую VL C, он работает нормально.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...