Мера оценки качества грязного изображения - PullRequest
0 голосов
/ 05 марта 2020

Я искал способ измерить (показатель качества изображения) степень загрязнения документа при обработке изображения. Пример изображения ниже:

a. Грязные фоны без текста

enter image description here

Может кто-нибудь дать мне первоначальную идею начать мой анализ? Я думал о том, чтобы преобразовать его в оттенки серого, затем суммировать уровни интенсивности изображения, а затем разделить его на 255, тогда это будет показатель качества изображения? Пожалуйста, помогите мне с этим. Благодаря.

Ответы [ 2 ]

1 голос
/ 16 марта 2020

Прежде всего, я предполагаю, что у вас не очень много сэмплов (что типично для задач такого типа). Для нахождения оценки сходства не очень оптимально просто обучать CNN со счетом 0 и 1 и решать как проблему регрессии.

Вместо этого, из предыдущего опыта, я обнаружил, что сиамская сеть и потеря триплета Идея, основанная на принципе, работает намного лучше, так как это несколько метаобучающий подход и работает с несколькими примерами (обучение в несколько шагов).

Идея состоит в том, что у вас будет CNN с последним слоем, являющимся слоем внедрения, вы выберите один якорь (наиболее характерное грязное изображение из всех имеющихся у вас грязных изображений и наиболее представительное чистое изображение из всех имеющихся у вас чистых изображений). Теперь вы пропустите чистое изображение (+) и грязное изображение (-) через сети, сравните их с изображением привязки, если привязка чистая, то вы пытаетесь сделать вектор внедрения привязки (чистым) и знак + похожим, и попытаетесь сделать вектор внедрения привязки (чистым) и + будет отличаться, и наоборот.

Вы можете просто взять L2-норму вложений и Возьмите разницу, для того же типа вы установите выход 0, а для разных случаев вы установите 1.

Существует множество реализаций, доступных в Keras, PyTorch, Tensorflow. Вот простой пример: https://medium.com/@prabhnoor0212 / siamese-network-keras-31a3a8f37d04

1 голос
/ 16 марта 2020

Вы должны быть немного более точным c с точки зрения ограничений. У вас есть помеченные данные? Вы можете маркировать это? Вы можете создать это? (у вас есть набор известных грязных изображений с грязной оценкой, назначенной каждому ~ нескольким сотням изображений, которые должны это делать)

Если вы это сделаете, я бы обучил CNN глубокого обучения этим данным, чтобы выводить оценку между 0 и 1.

Взгляните на https://course.fast.ai/videos/?lesson=1, который является очень хорошим курсом для начинающих, ai библиотекой и отправной точкой.

...