MPEG DASH поддерживает информацию о субтитрах, либо в виде отдельного файла, либо в контейнере mp4.
Существуют различные форматы, определенные для субтитров, но из описания ваших потребностей это звучит как W3C TTML.match.
Это поддерживает CSS для стилизации текста - в спецификации есть такие примеры:
<region xml:id="r1">
<style tts:extent="306px 114px"/>
<style tts:backgroundColor="red"/>
<style tts:color="white"/>
<style tts:displayAlign="after"/>
<style tts:padding="3px 30px"/>
</region>
...
<p region="r1" tts:backgroundColor="purple" tts:textAlign="center">
Twinkle, twinkle, little bat!<br/>
How <span tts:backgroundColor="green">I wonder</span> where you're at!
</p>
Полная спецификациядоступно здесь (на момент написания): https://www.w3.org/TR/2018/CR-ttml2-20180313/, и вы можете увидеть некоторые обсуждения и примеры здесь: https://github.com/rbouqueau/TTML_in_MP4_DASH_statement