Чтобы объединить файлы WAV или AIFF, вы можете сделать что-то вроде этого: (вдохновение от здесь )
import aifc
def concatenate(*items):
data = []
for item in items:
f = aifc.open(item, 'rb')
data.append([f.getparams(), f.readframes(f.getnframes())])
f.close()
output = aifc.open('output.aif', 'wb')
output.setparams(data[0][0])
for item in data:
output.writeframes(item[1])
output.close()
См. Ссылку для формата wav (он почти такой же, но с библиотекой wave)
Чтобы добавить тишину, я бы просто сделал файл молчания за одну секунду, используя ваш любимый аудиоредактор, и затем конкатенировал в нужном количестве тишины.