Как я могу улучшить модель тензорного потока для распознавания обнаружения номерного знака транспортного средства? - PullRequest
0 голосов
/ 26 октября 2018

Я боролся за неделю, чтобы обучить модель, которая может дать мне ограничительные числа для извлечения регистрационных знаков транспортных средств. (Это инициатива правоохранительных органов.) Последняя попытка - их было много - прошла так:

  1. Я использовал предварительно обученную модель для домашних животных.
  2. Я делал снимки дорог и накладывал разные регистрационные знаки на каждое изображение дороги. Пластина всегда находится в одном и том же положении, чтобы упростить генерацию XML-файлов.
  3. Увеличены размеры планшетов до 300x80 - ранее гораздо меньше с похожими результатами.
  4. 1600 обучающих изображений и 200 тестовых изображений.
  5. Преобразовал xml в csv, а затем в формат tfrecord.
  6. Обучил модель с помощью ssd_mobilenet_v1_pets.config с небольшими изменениями, такими как num_classes и num_examples и paths.
  7. Обучался на экземпляре графического процессора AWS в течение нескольких часов.

Результаты ужасны. Ветровые стекла обнаруживаются как пластины и квадратные фасады транспортных средств. Я могу загрузить, если это поможет.

Я собираюсь отказаться и использовать алгоритм извлечения текста, но это приносит другие сложности, такие как игнорирование другого текста на изображении.

Я ненавижу сдаваться, поэтому любой совет охотно принимается.

Спасибо, Алан.

1 Ответ

0 голосов
/ 26 октября 2018

Уч. Проголосовал уже. Извиняюсь. Помечено как ответ. Думаю, я неправильно понял, как формулировать вопросы. План Б это.

...