Не знаю, почему я не подумал об этом до -
Я делал инструмент поиска по словарю и хотел добавить к нему произношение. Вместо того, чтобы использовать преобразование текста в речь, которое дает роботизированный звук, я выбрал другой подход. M-W.com имеет человеческие голоса, записанные в файлах .wav для большинства слов. Поэтому я делаю скрининг на веб-сайте Merriam-Webster, чтобы получить wav-файл для слова, а затем просто играю , что . Если ваше приложение будет подключено, то, возможно, это будет работать и для вас.
Это поток, через который он проходит:
pronouncing Tricky...looking up 'Tricky'...
dictionary page: http://www.merriam-webster.com/dictionary/Tricky
got dictionary page markup, 35828 chars...
getting pronunciation uri...
got uri: 'http://www.merriam-webster.com//cgi-bin/audio.pl?tricky01.wav=tricky'...
getting page markup...
got pronunciation page markup, 3498 chars...
getting wav uri...
got wav uri: 'http://media.merriam-webster.com/soundc11/t/tricky01.wav'...
getting wav data...
got wav data, 6260 bytes...
playing wav data.
done.
Вот некоторый исходный код прототипа, который делает это .
Это работает на .NET Framework 2.0, а также на .NET CF 2.0. Это просто иллюстрация. Это своего рода наивный выбор правильного .wav-файла, когда есть несколько форм слова и несколько произношений. Если вы попросите форму множественного числа, вы можете ее не получить. Также вы можете добавить кеширование и дополнительную обработку исключений, чтобы укрепить его.