Я пытаюсь найти хорошее объяснение того, как работает статистический машинный перевод.То есть, если у меня есть набор неприсоединившихся текстов на английском, французском и немецком языках, как я могу использовать это для перевода любого предложения с одного языка на другой?Не то чтобы я сам собирался создать Google Translate, но я хотел бы понять, как это работает более подробно.
Я видел, что искал в Google, но ничего хорошего не нашел, он либо быстро нуждается в углубленных знаниях по математике, либо слишком обобщен.Статья Википедии о SMT, кажется, и то, и другое, так что это не очень помогает.Я скептически отношусь к тому, что это такая сложная область, которую просто невозможно понять без всей математики.
Может кто-нибудь дать или узнать общее пошаговое объяснение того, как такая системаработает, нацелена на программистов (так что примеры кода в порядке), но без математической степени, чтобы понять?Или книга, подобная этой, тоже была бы великолепна.
Редактировать : прекрасным примером того, что я ищу, был бы SMT, эквивалентный Отличная статья Питера Норвига по орфографиикоррекция .Это дает хорошее представление о том, что входит в написание проверки орфографии, не вдаваясь в подробные сведения о алгоритмах Левенштейна / Соундекса / сглаживания и т. Д. ...