Распознавание шаблонов в наборе данных - PullRequest
0 голосов
/ 17 октября 2018

У меня есть огромный набор данных изображений, которые я хочу отсортировать.Многие изображения - просто случайный шум, который мне не нужен, но некоторые из них содержат шаблоны, которые я хотел бы обработать дальше.

Вот пример: enter image description here

Здесь шаблоны выглядят как линии.Какие возможности у меня есть, чтобы сохранить только картинки, которые содержат некий узор?

1 Ответ

0 голосов
/ 17 октября 2018

У вас есть проблема классификации (структура против шума).Как говорили некоторые люди в комментариях, это очень расплывчатый и широкий вопрос, например, начальный вопрос в курсе обработки изображений или распознавания образов.Тем не менее, я попытаюсь объяснить, как это может работать, предполагая, что у вас нет предыстории по темам.

Сначала вам нужно получить некоторые функции или параметры из изображений, а затем определить, как значения этих функцийсвязанные с зашумленными изображениями и структурированными изображениями.

На практике вам необходимо прочитать файлы изображений и преобразовать их в значения, чтобы обработать их и попробовать метод классификации.

Это пример, который может или не может работать:

Как видно из предоставленных вами изображений, ваши изображения черно-белые, и предположим, что после импорта ониимеют значения от 0 (черный) до 255 (белый).Предполагая, что они имеют размер 40 x 40 пикселей, я могу подумать, что простая функция - это среднее значение пикселей.

Я вижу паттерны , представляющие собой белые линии, поэтому я бы сказал, что среднее значениеЭти изображения будут выше, чем в среднем шумных изображений, которые не имеют белых пикселей.Затем вы можете обнаружить, что среднее значение для изображений с шумом может составлять, например, [110, 100, 112, 98], а среднее значение для изображений с рисунками может составлять [130, 135, 125, 131].Если это так, вы можете использовать порог в качестве метода классификации.Например, если среднее значение больше 125, считается, что изображение содержит шаблон, в противном случае это шум.

Если для разделения классов недостаточно использования среднего, следует использовать более сложные функции., в этом случае вам нужно использовать некоторую обработку изображений, машинное обучение или любой другой подход, который может соответствовать вашим требованиям

...