Сравнение результатов Android OCR с базой данных - PullRequest
0 голосов
/ 16 октября 2018

Итак, я пытаюсь использовать OCR для перевода текста, который я записываю камерой своего телефона, в строку. В настоящее время я использую OCR Google vision для Android и правильно внедрил OCR, проблема в том, что иногда результат нетак хорошо, как и ожидалось, поэтому решение, которое, как мне кажется, может сработать, сопоставляет результат, полученный OCR, с моей базой данных.Например, если моя камера читает "Как ты?"тогда я бы нашел в своей базе данных запись, которая похожа "Как дела?"и будет отображать это вместо.Таким образом, реальная проблема заключается в том, что OCR постоянно читает с камеры, что означает, что мне нужно будет отправлять HTTP-запрос на сервер и запрашивать в базе данных аналогичное совпадение каждую секунду или две и ждать ответа, который можетбудет очень плохое выполнение, если есть много пользователей, перегружающих сервер.Одним из решений, которое я подумал, было скачивание списка всех строк в базе данных и локальное сопоставление, но что, если после этого данные изменятся в базе данных?Что может быть хорошим подходом к этому?

Я использую это, чтобы прочитать текст из продуктов супермаркета, такой как название и описание, так что я думаю, что это соответствует названию продукта, а затем запросить в моей базе данных всю дополнительную информацию,Важно отметить, что этим будут пользоваться люди с нарушениями зрения, поэтому чтение штрих-кодов не является хорошим выбором сейчас.

1 Ответ

0 голосов
/ 17 октября 2018

Вот мои 2 цента.

Одним из решений, которое я подумал, было скачивание списка всех строк в базе данных и локальное сопоставление, но что, если после этого данные изменятся в базе данных?Что было бы хорошим подходом к этому?

Это зависит от размера вашей базы данных.Если он не слишком большой, вы можете загрузить его на устройство пользователя.Если в базе данных есть обновление, вы можете реализовать механизм push, используя FCM , чтобы приложение знало, что существует новая версия базы данных для извлечения.Затем вы можете получить его в фоновом режиме и обновить локальную базу данных.Также я понимаю, что, поскольку вы создаете приложение для людей с нарушениями зрения, оно может не сработать, если вы просто попросите своих пользователей сделать снимок и выполнить распознавание текста на нем.Таким образом это предотвратило бы вызовы каждую секунду.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...