Распознавание текста Firebase MLKit не распознает простые числа во многих случаях - PullRequest
1 голос
/ 15 мая 2019

Firebase MLKit iOS Распознавание текста, кажется, работает очень хорошо, если текст отформатирован в абзаце или длинной фразе. Тем не менее, он не работает, если числа просто разбросаны, как в нашем случае, и если вокруг есть какая-то геометрия линии. Некоторые цифры распознаются правильно, а другие точно такие же цифры - нет.

Хотелось бы знать:

  1. Может ли команда MLKit улучшить эти случаи?
  2. Если мы можем настроить MLKit для поиска только чисел - это может улучшить производительность и, возможно, обнаруживаемость?
  3. Если описывается, какие изображения мы ожидаем в качестве входных данных, в случае, если это может помочь улучшить обнаружение, например, белый фон, только черные цифры, игнорировать геометрию и т. д.
  4. Если кто-то может порекомендовать лучший инструмент для IOS. Обратите внимание, что я не специалист по машинному обучению, я молод в этой области. )
  5. Какой-либо вид обработки изображения, который может быть сделан, чтобы улучшить результаты?

Для этого теста я использовал официальный проект быстрого запуска MLKit и, в частности, пример MLVisionExample. Вот несколько случаев:

enter image description here enter image description here enter image description here enter image description here enter image description here

Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...