Это фактическое смешивание, которое убивает вашу производительность? (то есть пропускная способность видеопамяти)
Какие игры обычно делают в наши дни, чтобы обрабатывать множество альфа-смешанных вещей (например, большие взрывы, которые покрывают весь экран): визуализировать их в меньшую текстуру (например, на 2x2 меньше или на 4x4 меньше, чем экран) и объединить их обратно на основной экран.
Это может потребовать рендеринга буфера глубины непрозрачных поверхностей в эту меньшую текстуру, чтобы правильно обрабатывать пересечения с непрозрачной геометрией. На некоторых платформах (консолях) выполнение мультисэмплинга или взлома буфера глубины может сделать эту операцию очень дешевой; нет такой удачи на обычном ПК, хотя.
См. Статью из GPU Gems 3, например: Высокоскоростные частицы вне экрана . В блоге Кристера Эриксона также рассматриваются многие подходы к оптимизации: Оптимизация рендеринга системы частиц