Я использую Keras (и Keras Retina Net), чтобы извлечь текст из фотографии и транскрибировать этот текст. Текст является частью документа, я извлекаю РИ из фотографии в небольшие фрагменты, подобные этим:
Причина извлечения ROI заключается в точности. Если я прогоню всю фотографию с помощью прогноза, она не даст ничего полезного. Метод с областями интереса работает, но довольно медленно.
Существует около 50-80 областей интереса на фотографию, каждая из которых занимает от 0,3 до 1,3 секунды, в зависимости от того, сколько текста находится на области интереса. Есть ли способ ускорить этот процесс?
Аппаратное обеспечение
- NVIDIA RTX 2080 Ti
- Intel (R) Core (TM) i5-4440 CPU @ 3.10 ГГц
- 32 ГБ оперативной памяти DDR4
Версия Tensorflow
- tenorflow-gpu 1.13.2 (устанавливается через базу)
Кто-нибудь знает другой способ расшифровки букв и цифр, который бы работал намного быстрее?