Я застрял в обучении модели распознавания символов на изображениях. В настоящее время я пытаюсь распознать буквы на относительно небольшом изображении (700x50), используя предопределенный fast-rcnn из репозитория обнаружения объектов TensorFlow. Изображения содержат до 13 букв, которые я хочу идентифицировать, и несколько более мелких символов и букв на заднем плане, которые не нужно распознавать.
Я уже обучил некоторые модели принятию в конфигурационных файлахTensorFlow моделирует зоопарк (с использованием python), и результаты в обучении (точность классификации и потери) хороши. Тем не менее, прогноз коробки / предложение региона не работает для меня. При использовании модели на изображениях она всегда находит первый или первый и второй символ. Другой персонаж не найден моделью вообще. Я уже пытался настроить параметры привязки и другие вещи, но это не важно для моего вопроса.
Мой вопрос сейчас: Как вывести ящики / якоря, предсказанныепредложение региона (RPN) в моей модели? Я хотел бы узнать, как я должен изменить свою модель, чтобы понять, что происходит, и почему другие буквы даже не найдены - не говоря уже о том, чтобы правильно классифицировать. Но чтобы выяснить это, я должен знать, что делает RPN, чтобы понять, почему моя модель находит только первые две буквы, хотя я уже пытался изменить многие параметры, такие как размеры привязки или максимальные прогнозы ...
Если у кого-то есть волшебный ответ о том, как я могу вывести предложения RPN в модели более быстрого RCNN TensorFlow, так что оттуда я могу узнать, почему они не попадают в окончательные результаты, это было быздорово. Но я также рад советам о том, как мне действовать дальше - например, построить RCNN самостоятельно и не использовать модели в зоопарке TensorFlow или что-то еще. Поскольку я буду продолжать работать над этой моделью в течение нескольких месяцев, приветствуются любые советы о том, как глубже создать лучшую модель.
Заранее спасибо.