Добавить поддержку японского в OCR | RPA - PullRequest
2 голосов
/ 24 февраля 2020

Как я могу добавить Japanese language с OCR? Я хотел бы знать, где находятся language files и как их выбрать.

1 Ответ

2 голосов
/ 24 февраля 2020

Intellibot поддерживает следующее ocr engines Tesseract 4.0 (LSTM) ABBYY Abbyy Cloud Google Cloud Microsoft Cloud Amazon Cloud Modi (должен быть установлен отдельно на машине)

Tesseract 4.0 - хороший механизм распознавания текста и может свободно использовать. По умолчанию для компонента OCR Text установлено использование Tesseract с языком English. Двигатель и язык можно выбрать в окне настроек Ocr, к которому можно получить доступ double-clicking на title OCR TEXT компонента.

enter image description here

Для использования языка Japanese с Tesseract Загрузите файл обученных данных японского языка по ссылке, указанной ниже

https://github.com/tesseract-ocr/tessdata/blob/master/jpn.traineddata

, затем разместите его по следующему пути к файлу

"% localappdata% \ INTELLIBOT \ ed611e32-2c12-4040-a1f0-4f8184df3000 \ 0a634a0b-d535-4343-9963-23ab0d5a8702 \ 293745f8-12ea-4a86-be5f5d5a5a5a5f5d5e5f5d5d5d5f5555555555555555555555555555555555555555555555555555555555555555555555555555 К5д 8

затем reopen Intellibot Studio.

Теперь выберите «jpn» в раскрывающемся списке «Язык», как показано ниже:

enter image description here

...