Question

Firebase MLKit iOS Распознавание текста, кажется, работает очень хорошо, если текст отформатирован в абзаце или длинной фразе. Тем не менее, он не работает, если числа просто разбросаны, как в нашем случае, и если вокруг есть какая-то геометрия линии. Некоторые цифры распознаются правильно, а другие точно такие же цифры - нет.

Хотелось бы знать:

Может ли команда MLKit улучшить эти случаи? Мы очень близки к идеальным результатам, но что-то заставляет пропускать 1-2 номера каждый раз.
Есть ли способ намекнуть MLKit, какой текст мы ищем в сцене? Я думаю, это может повысить производительность, особенно при конвертации живого видео, и использовать модель меньшего размера.
Какой-либо вид обработки изображения, который может быть сделан, чтобы улучшить результаты?

Для этого теста я использовал официальный проект быстрого запуска MLKit и, в частности, пример MLVisionExample. Вот несколько случаев: