В Windows самое лучшее, что я нашел, это использование речевого API и голосов AT & T Natural Voices: http://www2.research.att.com/~ttsweb/tts/demo.php
Однако они ОЧЕНЬ дороги, если вообще доступны. Я сталкивался с проектами, в которых модель использования / бизнес была настолько далека от того, о чем думала AT & T, что они даже не продадут лицензию.
Есть альтернатива бесплатному программному обеспечению, Festival: http://www.cstr.ed.ac.uk/projects/festival/, но качество ужасное. Это на 10 лет отстает от текущего качества звука коммерческих систем. Это однако бесплатно.
Третий вариант, который мне очень помог, - это перенести часть синтеза голоса из нескольких проектов на OS X. OS X имеет приличный набор инструментов и речевой APIS и довольно приличный набор стандартных голосов. Недостатком, конечно, является то, что программы, написанные для этих API, работают только под OS X, которая работает только на оборудовании Apple.