Для музыки следующий подход будет сильно отличаться.
Поскольку это всего лишь голос, вы можете значительно уменьшить частоту дискретизации в большинстве случаев.Попробуйте [8 кГц ... 20 кГц].
В случае, если они многоканальные - моно должно подойти для голоса.
Как только это будет сделано, я рекомендую AAC для баланса размера и качества.
Проведите несколько тестов прослушивания на ваших устройствах.Настройки твика при необходимости.Затем пакетный процесс / конвертировать их все.Это может уменьшить ваши размеры на десять и более, если источники имеют размер 16 / 44,1.
Если они не очень маленькие (например, по секундам), или если вам придется быстро открывать и читать многие из них, я бы не сталвозиться с огромным файлом.Несколько МБ - хороший размер для многих случаев.