Объяснение параметров SAP OCR - PullRequest
0 голосов
/ 22 ноября 2018

У меня есть несколько вопросов относительно параметров службы SAP OCR.Как указано в Документация , есть несколько различных опций для режима сегментации страницы и типа модели машинного обучения.Описание этих параметров действительно короткое.Кто-нибудь знает, где я могу найти более подробное описание?

Вопросы о modelType
Относительно различных типов модели Я хотел бы знать разницу между lstmPrecise, lstmFast и lstmStandard.Я знаком с ячейками LSTM, но не нашел никакой информации о том, что делает «точную модель» точной, «быстрый режим» быстрым и т. Д.

Существует также модель с «ячейками LSTM истандартные алгоритмы обработки ».Есть ли какая-либо информация о том, какие стандартные алгоритмы обработки используются?

Я также ищу информацию об обучении этих моделей.

Вопросы о странице SegMode

Большинство опций довольно понятны, однако я наткнулся на pageSegmode 13 - «Необработанная строка. Обрабатывайте изображение как одну текстовую строку, минуя хаки, специфичные для Tesseract».Я знаю Tesseract как бесплатное программное обеспечение для оптического распознавания символов.Предоставляется ли сервис SAP OCR на основе Tesseract?Какие специфичные для Тессеракта хаки обойдены?

Я действительно надеюсь, что есть кто-то, кто может помочь мне с этими вопросами или, по крайней мере, есть идея, которая может знать это.

Заранее спасибои всего наилучшего,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...