На самом деле, просто использовать API перевода Google , вероятно, самое лучшее и простое решение.
API Google прост в использовании и, в зависимости от переводимых языковых пар, их система перевода либо настолько же хороша, либо намного лучше, чем все остальное.
Пакеты перевода с открытым исходным кодом
Однако есть и несколько действительно хороших инструментов с открытым исходным кодом для машинного перевода. Современные пакеты включают в себя:
В отличие от API-интерфейсов перевода, вы можете использовать эти инструменты без доступа к Интернету. Что еще более важно, вы можете использовать эти инструменты без каких-либо ограничений или ограничений, налагаемых свободными API, если вы пытаетесь переводить большие объемы данных.
Данные обучения
Чтобы использовать пакеты машинного перевода с открытым исходным кодом, вам потребуются обучающие данные. Если вы переводите с английского на немецкий или с некоторых других европейских языков, вы можете использовать Europarl параллельный корпус Филиппа Кёна .
Если вам интересен язык Европейского Союза (ЕС), которого нет в параллельном корпусе Europarl, вы можете собрать данные, просканировав протоколы Европейского парламента . Все материалы ЕС переведены на каждый из языков ЕС и доступны бесплатно в Интернете, что делает их очень хорошим источником данных по обучению машинному переводу.