Построение Python OCR с использованием машинного обучения - PullRequest
0 голосов
/ 07 марта 2020

Существует множество вопросов, касающихся оптического распознавания текста и машинного обучения, я ищу руководство по созданию собственного с нуля.

У меня есть непристойное количество фотографий, которые содержат текст, относящийся к функции на фотографии. Текст - это широта, долгота и идентификатор объекта. Я ищу способ извлечь эту информацию в текстовый файл для подачи в мою ГИС.

Я уверен, что Tesseract и Pytesseract будут делать именно то, что я хочу, однако у меня есть блокировщик, который не может загрузить дополнительное программное обеспечение на P C, над которым я работаю.

My P C подключен к строго контролируемой и безопасной сети. Я не могу установить новое программное обеспечение. Однако я могу «установить pip» любые необходимые библиотеки Python, используя мобильную точку доступа. Я установил библиотеку Pytesseract в Python. Однако, если я понял, существует зависимость, требующая, чтобы установочный файл windows был загружен и установлен до того, как это сработает.

Поэтому я решил попробовать (в качестве побочного проекта) создать свою собственную модель распознавания текста, используя Python и любые библиотеки, которые мне нужны. Единственная проблема заключается в том, что в Интернете есть тонна информации, и попытка найти целенаправленный и простой для понимания процесс не легка.

Я ищу ресурсы, подробно описывающие, что мне нужно сделать, чтобы создать обучающий набор данных, обучить модель и передать изображения в модель поезда, чтобы получить вывод, который имеет смысл.

Я использовал OpenCv для обработки изображения (обрезка, фильтр и т. Д. c), чтобы получить ограничивающие рамки для всего идентифицируемого текста на тестовом изображении. Я не уверен, где go оттуда.

Существуют ли какие-либо рекомендуемые онлайн-учебники / ресурсы, которые могут иметь смысл для начинающего пользователя? Я использую Python 3,5.

...