Как конвертировать арабский текст в фонетику SAMPA? - PullRequest
2 голосов
/ 25 марта 2012

Мы делаем проект, который должен говорить по-арабски, и мы нашли инструмент с открытым исходным кодом, Mbrola , который может это сделать.

Однако мне также нужны некоторыеспособ преобразования арабского текста в фонетику SAMPA.Так может ли кто-нибудь помочь мне преобразовать арабский текст в фонетику SAMPA?

1 Ответ

0 голосов
/ 12 января 2013

Это гораздо проще сделать на арабском, чем, например, на английском.Это потому, что арабский язык в основном фонетический.Есть некоторые очень маленькие исключения, которые имеют очень регулярные правила, поэтому они должны легко обрабатываться.Например: 1) Harf Shamsia ... Al + (n, t, d, dh, l, s, sh) "l" ассимилируется с первой буквой последующего слова.2) Harf Qamaria ... Al + (все остальное), звук "l" остается.

Вот простая справочная таблица .(Предположительно, вы читаете по-арабски или у вас есть кто-то, кто может вам в этом помочь?).Вам нужно быть осторожным, чтобы принять во внимание тип кодировки текста вашего арабского источника, Unicode (и какой тип кодировки Unicode) или кодовую страницу 1256?

Этого должно быть достаточно, чтобы начать,Хороший успех!

...