Я работаю над проектом, который пытается прочитать буквы / цифры номерного знака на изображениях. До сих пор мы использовали Google VisionText как способ преобразования изображения в текст, но обнаружили, что он очень ограничен и часто допускает ошибки, особенно различая 0
(ноль) и O
.
. В проекте мы собираемся создать собственную модель ML, используя Google AutoML или TensorFlow.
Есть несколько правил, которые мы должны соблюдать, чтобы помочь обучить модель и сделать ее более точной. Причина в том, что в каждом штате есть стандартные номерные знаки, которые соответствуют определенным схемам. Эти правила предназначены для устранения неоднозначности вокруг похожих персонажей, таких как 0
(ноль) и O
.
Я вполне уверен, что при достаточном обучении мы могли бы научить модель различать guish из какого состояния пластины.
Мой вопрос: возможно ли добавить эти шаблоны в модель обучения, используя TensorFlow? Что-то вроде:
if plateState == 'state'
then regex('1[A-Z]{2}[0-9]{1}[A-Z]{2}')
end
По сути, давая машине четкое правило, помогающее найти правильный ответ.
Или мы смотрим на это неправильно и должны обучать модель, используя множество изображений, и позволить модели создавать правила?
В конечном итоге мы хотим, чтобы машина возвращала значение номерного знака и его состояние.
Спасибо.