Извините за заголовок, это немного сложно объяснить кратко!
У меня есть куча коротких (1-4) записей людей, читающих предложения. Они были записаны сами. Часто в начале или в конце возникает некоторое молчание, и я хотел бы автоматизировать его удаление.
В качестве первого прохода я использовал эту команду:
sox original.mp3 edited.mp3 silence 1 0.1 2% reverse silence 1 0.1 2% reverse
Проблема в том, что когда люди говорят, иногда самое начало их речи тихое и быстро нарастает. Таким образом, эта команда обрезает самое начало ряда предложений.
Итак, я хотел бы сделать то же самое, что и команда sox, но в идеале, когда она обнаруживает границу, она оставляет 50 мс до границы, признавая, что могут быть некоторые тихие, но важные звуки.
Я думаю, что ffmpeg мог бы быть хорошим инструментом для этого, так как я не думаю, что sox можно настроить таким образом. Я инструмент агности c. Хотя я вообще не знаю ffmpeg, поэтому я ценю любую помощь в составлении команды с довольно загадочным синтаксисом ffmpeg!
Еще один приятный момент, который есть над вышеупомянутой командой sox, - это только удалить тишину в начале и конец (если он существует) - не с середины записи.
ОБНОВЛЕНИЕ: исходя из времени, проведенного с ffmpeg, похоже, что я хочу что-то вроде этого
ffmpeg -i input.mp3 -af "silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak,areverse,silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak,areverse" output.mp3
Странно это искажено. Я подумал, что он не работает должным образом, но когда я пытаюсь сделать что-то вроде
ffmpeg -i input.mp3 -af areverse output.mp3
Это не работает - я просто возвращаю ввод. Я не уверен, что происходит не так?
Если я просто начну,
ffmpeg -i input.mp3 -af "silenceremove=start_periods=1:start_threshold=0.02:start_silence=0.1:detection=peak" output.mp3
Это отлично работает - для начала. Но не уверен, почему обратный трюк приводит к искаженному выводу.
UPDATE2: на самом деле похоже, что команда работает, но он меняет метаданные таким образом, что делает itunes выигрышным. Если я использую VL C, он работает нормально.