Насколько я знаю, mp3-сжатие ОЧЕНЬ грубо выглядит примерно так:
- берет кадр сэмплов
- преобразует их в частотный диапазон
- отбрасывает частоты, которые ниже определенного порога (который является сжатием)
Поэтому, если у вас есть только mp3-данные, у вас должны быть куски / кадры частот (с индексом).Чтобы смешать потоки, вы должны взять соответствующие кадры из каждого потока и создать новый кадр, который, например, состоит из f (idx) = fA (idx) + fB (idx) / 2.Имейте в виду, что кадры имеют разную длину, поскольку присутствуют не все индексы (idx), потому что некоторые частоты отбрасываются для сжатия.Я надеюсь, что это помогает для начала.Я знаю, что это не полное решение.