Я заинтересован в написании сценария PHP (я приветствую предложения, не зависящие от языка), который транслитерирует предложение или слово, написанное на английском (фенетически), в сценарий другого языка. Поскольку я смотрю на английский язык, написанный фенетически (то есть на слух): мне придется иметь дело с вариантами написания одного и того же слова.
Предполагается, что не существует никакого стандарта для романизации (например, на китайском языке у вас есть упрощенный вейд и т. Д.)
У кого-нибудь есть совет, с чего мне начать?
РЕДАКТИРОВАТЬ: я делаю это исключительно в образовательных целях, и у меня изначально сложилось впечатление, что для того, чтобы выяснить связь между вариантами написания (которые можно найти в корпусе сообщений IM, сообщения Facebook, написанные в романизированная форма языка), вам понадобится какой-нибудь инструмент машинного обучения. Тем не менее, я хотел бы знать, был ли я на правильном пути, и я хотел бы получить некоторую помощь в выяснении того, что мне следует изучить, чтобы получить эту работу (например: какой инструмент машинного обучения мне следует изучить?) ,