Распознавание текста Firebase MLKit не распознает номера в определенных случаях - PullRequest
1 голос
/ 16 мая 2019

Firebase MLKit iOS Распознавание текста, кажется, работает очень хорошо, если текст отформатирован в абзаце или длинной фразе. Тем не менее, он не работает, если числа просто разбросаны, как в нашем случае, и если вокруг есть какая-то геометрия линии. Некоторые цифры распознаются правильно, а другие точно такие же цифры - нет.

Хотелось бы знать:

  1. Может ли команда MLKit улучшить эти случаи? Мы очень близки к идеальным результатам, но что-то заставляет пропускать 1-2 номера каждый раз.
  2. Есть ли способ намекнуть MLKit, какой текст мы ищем в сцене? Я думаю, это может повысить производительность, особенно при конвертации живого видео, и использовать модель меньшего размера.
  3. Какой-либо вид обработки изображения, который может быть сделан, чтобы улучшить результаты?

Для этого теста я использовал официальный проект быстрого запуска MLKit и, в частности, пример MLVisionExample. Вот несколько случаев:

enter image description here enter image description here enter image description here enter image description here enter image description here

Большое спасибо!

...