CNN OCR Машинно-читаемая зона - PullRequest
1 голос
/ 20 марта 2019

Я обучаю сверточную нейронную сеть распознавать символы MRZ (машиночитаемой зоны) на смартфоне. Я хочу знать, должен ли я для тренировки точности использовать несколько шрифтов, даже если MRZ использует только OCR-B. Кроме того, модель не работает на устройстве с тем же уровнем точности, что и в коде Python, который я использую для обучения / тестирования. Есть идеи?

Это архитектура, которую я использую:

    model = Sequential()
    model.add(Convolution2D(filters=32, kernel_size=(3, 3), strides=(2, 2), activation='relu', input_shape=input_shape))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.5))
    model.add(Convolution2D(filters=64, kernel_size=(1, 1), strides=(1, 1), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

1 Ответ

1 голос
/ 20 марта 2019

Если в MRZ используется только один шрифт, то для обучения CNN следует использовать только этот шрифт.
Для улучшения результатов необходимо предварительно обработать изображение перед его передачей в CNN, например, сначала идентифицировать текстзоны в изображении и затем передают их через CNN.

Точность модели может изменяться от устройства к другому из-за архитектуры процессора, например, CPU и GPU будут получать разные результаты из-за численная стабильность .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...