Подача каждого пикселя растрового изображения непосредственно в нейронную сеть потребует большой подготовки и не будет хорошо работать для масштабирования или поворота изображения.
Чтобы помочь нейронной сети выполнить хорошую классификацию, вам нужно выполнить некоторые шаги предварительной обработки.
- Нормализация изображения:
- Настройка контрастности и яркости так, что гистограмма изображения соответствует эталонному изображению.
- Размытие изображения, чтобы удалить шум.
- Преобразуйте его в черно-белое, используя некоторый порог.
- Найдите ограничивающую рамку фигуры, масштабируйте до заранее определенного размера.
- Рассчитайте различные особенности изображения, которые можно использовать для различения одной цифры от другой:
- Номер Эйлера изображения & mdash; говорит вам, сколько «отверстий» в форме (например, два отверстия для цифры 8).
- Количество белых пикселей (область цифры)
- главных компонентов набора координат белых пикселей & mdash; рассказывает, насколько «вытянута» форма.
- ... другие функции, о которых вы можете подумать, имеют сходные значения для похожих цифр.
Основные компоненты также можно использовать для нормализации вращения фигуры, чтобы самая длинная ось была вертикальной.
Функции - это то, что вы вводите в нейронную сеть для классификации, а не пиксели.