Не знаю, будете ли вы открыты для этого, но, возможно, вам подойдет облачное решение с несколькими голосами?Снова, я не слишком знаком с этим, но у iSpeech, кажется, есть Android SDK и позволяет прямой доступ API для преобразования текста в речь и ASR.
Если вы попробуете это, дайте мне знать, как это.
Найден их сайт: http://www.ispeech.org/developers