Я хотел бы извлечь фонемы произношения по умолчанию (американский английский) для данного слова (необязательно существующего в словаре речи Windows) с использованием инфраструктуры SAPI 5.4. Я должен сделать это через SAPI, чтобы я мог также использовать данные для манипулирования речевым словарем Windows. В настоящее время мой метод извлечения фонем включает в себя:
- Голосовое слово с преобразованием текста в речь и сохранением вывода в формате .wav
- Используйте .wav в качестве входных данных для распознавания речи
- При распознавании слова извлеките фонемы из распознанных словосочетаний
Этот метод отлично работает в моем приложении, хотя я не пробовал его в большом масштабе (последовательное извлечение фонемы для списка слов). Существуют ли другие (более эффективные) способы извлечения данных фонемы для данного слова?