Обратные фонемы не включены в словарь CMU - PullRequest
0 голосов
/ 09 июня 2018

Словарь произношения Университета Карнеги-Меллона позволяет получать фонемы из слов.Я провел некоторые исследования в Интернете, и оказалось, что существуют некоторые расширения, такие как LOGIOS Lexicon Tool, который выводит фонемы для произвольных слов, которые могут не входить в исходный словарь CMU (http://www.speech.cs.cmu.edu/tools/lextool.html). То же самое можно получить с помощьюиспользуя модель нейронной сети (https://github.com/cmusphinx/g2p-seq2seq),, чтобы в основном для каждого слова мы могли получить соответствующие фонемы.

Но обратим ли процесс для каждого слова? Очевидно, для слов, уже содержащихся в словаре CMU,в обратном направлении нет необходимости, поскольку слово прикреплено к соответствующим фонемам. Но как я могу получить слово из произвольных фонем? Это инструмент для этого (возможно, в Python) или я должен реализовать обратное самостоятельно, возможно, глядя на исходный код, делаяанализ слова в фонему и попытка вернуть его (если это возможно)?

1 Ответ

0 голосов
/ 12 июня 2018

Наиболее естественным способом является обучение некоторой модели нейронной сети seq2seq для выполнения преобразования фонемы в графему.

g2p-seq2seq, используемый для поддержки режима фонемы в графему, см. Github issue , ноэта функция была потеряна в недавнем обновлении.Было бы неплохо вернуть его обратно.

...