Question

В настоящее время я использую этот код, чтобы разрезать аудиофайл на маленькие кусочки:

sound = AudioSegment.from_mp3("1.WAV")
f=open("decoded.txt", "a+")
chunks = split_on_silence(sound,min_silence_len=280,silence_thresh=-33,keep_silence=150)

for i, chunk in enumerate(chunks):
    print(i)
    print("\n")
    chunk.export(folder+"/chunk{0}.wav".format(i), format="wav")
    AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), folder+"/chunk{0}.wav".format(i))
    r = sr.Recognizer()
    with sr.AudioFile(AUDIO_FILE) as source:
        print("Listening...")
        audio = r.record(source)  # read the entire audio file
        f.write((r.recognize_google(audio) +" "))

f.close();

Это создает куски файлов, разделенные по тишине ... Но я хочу, чтобы всякий раз, когда аудио разделялосьследующий фрагмент начинается с 2 секунд назад, так что может появиться любое слово, которое может быть вырезано.Что-то вроде того, если время молчания 10,13,18,22, тогда мои срезы должны быть 0-10,8-13,11-18,16-22.Я использую Pydub для расщепления по умолчанию.Могу ли я что-то изменить в pydub или есть какой-то другой пакет, который работает?

Anil_M · Answer 1 · 24 октября 2018

Поскольку каждый фрагмент разбивается по умолчанию, он не будет иметь данных за предыдущие 2 секунды.
Однако, что вы можете сделать, это сделать копию последних 2 секунд предыдущих фрагментов (n-1) и объединить сследующий блок (nth), пропуская первый блок.

псевдокод, как показано ниже,

n1 + n2 + n3 + ...n #audio chunks that are split on silence
n1 + (<last 2 seconds of n1> + n2) + (<last 2 seconds of n2> + n3) + ...

Вы также можете играть с keep_silence чтобы узнать, какое значение имеет смысл для ваших требований.

Другая идея состоит в том, чтобы использовать pydub.silence.detect_nonsilent () , чтобы найти диапазоны молчания и самостоятельно принять решение о том, гденарезать оригинальное аудио.

Я оставлю это как упражнение для вас.

Как разделить аудиофайл на основе молчания и перекрыть последние, скажем, 2 секунды в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как разделить аудиофайл на основе молчания и перекрыть последние, скажем, 2 секунды в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы