Я боролся за неделю, чтобы обучить модель, которая может дать мне ограничительные числа для извлечения регистрационных знаков транспортных средств. (Это инициатива правоохранительных органов.) Последняя попытка - их было много - прошла так:
- Я использовал предварительно обученную модель для домашних животных.
- Я делал снимки дорог и накладывал разные регистрационные знаки на каждое изображение дороги. Пластина всегда находится в одном и том же положении, чтобы упростить генерацию XML-файлов.
- Увеличены размеры планшетов до 300x80 - ранее гораздо меньше с похожими результатами.
- 1600 обучающих изображений и 200 тестовых изображений.
- Преобразовал xml в csv, а затем в формат tfrecord.
- Обучил модель с помощью ssd_mobilenet_v1_pets.config с небольшими изменениями, такими как num_classes и num_examples и paths.
- Обучался на экземпляре графического процессора AWS в течение нескольких часов.
Результаты ужасны. Ветровые стекла обнаруживаются как пластины и квадратные фасады транспортных средств. Я могу загрузить, если это поможет.
Я собираюсь отказаться и использовать алгоритм извлечения текста, но это приносит другие сложности, такие как игнорирование другого текста на изображении.
Я ненавижу сдаваться, поэтому любой совет охотно принимается.
Спасибо,
Алан.