Как построить точную систему перевода? - PullRequest
2 голосов
/ 22 декабря 2010

Несколько месяцев назад я нашел формулу для себя, чтобы перевести любой исходный язык (компьютерные символы) по назначению (компьютерные символы). Использование Lua (настольные пользователи) и класса C ++ (для нативного доступа), чтобы я мог встраивать его в веб-браузер и т. Д. И т. Д.

Иногда я действительно неправильно транслирую грамматику или даже правила, прежде чем строить ее, я подумал, что это будет лучшим способом завершить, но сейчас это займет много времени, и я боюсь, что это может стать неправильной реализацией. Теперь я хочу проверить других и сравнить мои.

Я использовал Google переводчик или другие, которые не являются моей целью, я строил движок переводчика (например, Google или другие), где кто-то может поместить туда словарь и создать правила.

Существует ли какая-либо существующая структура или библиотеки перевода (OpenCOG или Moses) для перевода исходного языка в пункт назначения? пример: с арабского на китайский или с английского на японский? Или что еще Google / другие используют?

Любое предложение будет оценено.

Заранее спасибо.

Ответы [ 3 ]

5 голосов
/ 22 декабря 2010

Moses - довольно хорошая библиотека перевода с открытым исходным кодом для C ++. cdec представляет текущее состояние дел (но требует неконтекстных грамматик для исходного и целевого языков) Оба требуют большого количества обучающих данных, то есть параллельных корпусов.

Когда вы закончите, бегите в университет и потребуйте докторскую степень.

4 голосов
/ 22 декабря 2010

Ненавижу вас отговаривать, но вы пытаетесь в одиночку решить проблему Машинный перевод .Системы МП, такие как Systran , разрабатывались командами ученых и инженеров десятилетиями, и они все еще далеки от совершенства.

1 голос
/ 22 декабря 2010

Вы смотрели на Google Translator Toolkit API ? Проанализировав его аспекты, вы сможете получить представление о том, что он реализует, и о том, что вам может понадобиться для разработки собственной структуры перевода (кстати, много работы).

Создание / загрузка документов перевода

Полный список поддерживаемых исходных и целевых языков

http://www.leniel.net/2010/12/playing-google-translator-toolkit-api.html

Больше в стек:

Бесплатные системы и инструменты машинного перевода с открытым исходным кодом

GNU gettext

TinyTM - Память переводов с открытым исходным кодом

...