Как установить язык в Tess4J, используя язык с мобильного устройства? - PullRequest
0 голосов
/ 04 мая 2018

Я использую веб-сервис для чтения файлов изображений и возвращаю мне текст с помощью Tesseract.

Как мы знаем, Tesseract / Tess4j поддерживает ввод языков в формате ISO 639-3 (то есть: eng , spa , deu , ara и т. Д.), Но язык, который я получаю с мобильного устройства, представлен в следующем формате: en-gb , pt-br,. ..

Мой пользователь может использовать любой язык и запросить чтение изображения.

Мой вопрос: у кого-нибудь есть идеи, как это решить?

И еще, если я не установил язык, он угадывает / находит язык на картинке?

1 Ответ

0 голосов
/ 14 мая 2018

Мой вопрос: у кого-нибудь есть идеи, как это решить?

конвертировать / найти правильный язык, используя что-то вроде этого

    for (Locale locale : Locale.getAvailableLocales()) {
        System.out.println("" + locale
                + "; display: " + locale.getDisplayLanguage()
                + "; name: " + locale.getDisplayName()
                + "; lang: " + locale.getLanguage()
                + "; iso3: " + locale.getISO3Language());
    }

Тогда вы можете установить его в tess4j.

Ссылка на вышеуказанное

И еще, если я не установил язык, он угадывает / находит язык на изображении?

Я полагаю, что значение по умолчанию должно быть установлено, иначе это вызовет ошибку. (Не прошел исходный код)

...