Слияние подразумевает смешивание, но это звучит так, как будто вы имеете в виду здесь конкатенацию.
Чтобы выполнить конкатенацию с молчанием в середине, вам нужно вставить несколько кадров молчания в файл.Фрейм без вывода сообщений - это тот, в котором каждый канал имеет «0» - если вы используете подписанные сэмплы, то это буквально 0, для беззнаковых - maxvalue / 2.
В каждом кадре будет один сэмпл для каждого канала.,Таким образом, чтобы сгенерировать одну секунду тишины в формате CD, вы должны вставить 44100 (Гц) * 2 (количество каналов в кадре) = 88200 16-битных целочисленных значений со значением 0 каждый.Я не уверен, как получить доступ к необработанному файлу, абстрагированному аудио абстракциями Java, но это данные для вставки.