Firebase MLKit iOS Распознавание текста, кажется, работает очень хорошо, если текст отформатирован в абзаце или длинной фразе. Тем не менее, он не работает, если числа просто разбросаны, как в нашем случае, и если вокруг есть какая-то геометрия линии. Некоторые цифры распознаются правильно, а другие точно такие же цифры - нет.
Хотелось бы знать:
- Может ли команда MLKit улучшить эти случаи?
- Если мы можем настроить MLKit для поиска только чисел - это может улучшить производительность и, возможно, обнаруживаемость?
- Если описывается, какие изображения мы ожидаем в качестве входных данных, в случае, если это может помочь улучшить обнаружение, например, белый фон, только черные цифры, игнорировать геометрию и т. д.
- Если кто-то может порекомендовать лучший инструмент для IOS. Обратите внимание, что я не специалист по машинному обучению, я молод в этой области. )
- Какой-либо вид обработки изображения, который может быть сделан, чтобы улучшить результаты?
Для этого теста я использовал официальный проект быстрого запуска MLKit и, в частности, пример MLVisionExample. Вот несколько случаев:
![enter image description here](https://i.stack.imgur.com/LVZev.jpg)
Большое спасибо!