Что такое «энергия» в обработке изображений? - PullRequest
20 голосов
/ 30 декабря 2010

Я прочитал несколько книг и веб-сайтов, посвященных обработке изображений, но я все еще не уверен в истинном определении термина «энергия» в обработке изображений.Я нашел несколько определений, но иногда они просто не совпадают.

Когда мы говорим «энергия» в обработке изображений, что мы подразумеваем?

Ответы [ 13 ]

7 голосов
/ 30 декабря 2010

Это зависит от контекста, но, как правило, в обработке сигналов «энергия» соответствует среднеквадратичному значению сигнала (обычно измеряется относительно глобального среднего значения).Эта концепция обычно ассоциируется с теоремой Парсеваля , которая позволяет нам думать о полной энергии, распределенной по «частотам» (и, например, можно сказать, что изображение сконцентрировано в большей части своей энергии).на низких частотах).

Другое, связанное с этим использование используется в преобразованиях изображений: например, преобразование DCT (основа метода сжатия JPEG) преобразует блоки пикселей (изображение 8x8) в матрицу преобразованногокоэффициенты;для типичных изображений это приводит к тому, что, хотя исходное изображение 8x8 имеет свою энергию, равномерно распределенную среди 64 пикселей, преобразованное изображение имеет свою энергию, сконцентрированную в лево-верхних «пикселях» (которые, опять же, соответствуют «низким частотам»в некотором сходном смысле).

5 голосов
/ 30 декабря 2010

Энергия - довольно свободный термин, используемый для описания любой пользовательской функции (в области изображений).

Мотивация использования термина «Энергия» состоит в том, что типичные задачи обнаружения / сегментации объектаставится как проблема минимизации энергии.Мы определяем энергию, которая захватит желаемое решение, и выполняем градиентный спуск, чтобы вычислить его наименьшее значение, что приводит к решению для сегментации изображения.

4 голосов
/ 21 января 2017

Энергия - это мера локализованного изменения изображения.

Энергия получает множество разных имен и множество разных контекстов, но имеет тенденцию ссылаться на одно и то же.Это скорость изменения цвета / яркости / величины пикселей в локальных областях.Это особенно верно для краев объектов внутри изображения, и из-за характера сжатия эти области труднее всего сжимать, и поэтому вполне можно предположить, что они важнее, они часто являются краями или быстрыми градиентами.Это разные контексты, но они относятся к одному и тому же.

Алгоритм вырезания шва использует определения энергии (использует градиентную величину), чтобы найти наименее заметное, если его удалить.JPEG представляет локальный кластер пикселей относительно энергии первого.Алгоритм Снейк использует его, чтобы найти локальный контур предмета на изображении.Так что есть много разных определений, но все они относятся к типу привлекательности изображения.Является ли это суммой локальных пикселей с точки зрения квадрата абсолютной яркости или жестких битов, сжимаемых в формате JPEG, или границ при обнаружении Canny Edge, или величины градиента:

Важным битом является энергиявот где материал.

Энергия изображения в более широком смысле - это расстояния некоторого качества между пикселями некоторой местности.

Мы можем взять сумму цветовых расстояний LABdE2000 в пределахправильно взвешенное двумерное гауссовское ядро.Здесь расстояния суммируются вместе, локальность определяется гауссовым ядром, а качество - цветом, а расстояние - формулой LAB Delta от 2000 года (Ошибка: ранее заявленный E означал евклидово, но расстояние для стандартной дельты E - евклидовоно формулы 94 и 00 не являются строго евклидовыми, а «Е» означает «Empfindung» (по-немецки «сенсация»).Мы также можем сложить локальное ядро ​​3x3 с локальной разницей в яркости или квадратом яркости и т. Д. Нам нужно измерить локализованное изменение изображения.

skull default

В этом примере local определяется как двумерное гауссово ядро, а цветовое расстояние - как алгоритм LabDE2000.

skull energy

Если вы взялиизображение и переместил все пиксели и отсортировал их по цвету по какой-то причине.Вы бы уменьшили энергию изображения.Вы можете взять коллекцию из 50% черных пикселей и 50% белых пикселей и расположить их как случайный шум для максимальной энергии или поместить их как две стороны изображения для минимальной энергии.Аналогично, если бы у вас было 100% белых пикселей, энергия была бы равна 0 независимо от того, как вы их расположили.

2 голосов
/ 02 января 2011

Энергия изображения должна быть обратно пропорциональна Энтропия Шеннона изображения.Но, как уже говорилось, энергия изображения является слабо связанным термином, лучше вместо этого использовать термин «сжимаемость».То есть - высокая «энергия» изображения должна соответствовать высокой сжимаемости изображения.

http://lcni.uoregon.edu/~mark/Stat_mech/thermodynamic_entropy_and_information.html

2 голосов
/ 30 декабря 2010

Возвращаясь к моей химии - энергия и энтропия тесно связаны между собой. И Энтропия, и Случайность также тесно связаны. Таким образом, в обработке изображений энергия может быть похожа на случайность. Например, изображение плоской стены имеет низкую энергию, а изображение города, сделанное с вертолета, может иметь высокую энергию.

2 голосов
/ 30 декабря 2010

Существует несколько определений "энергии" при обработке изображений, поэтому это зависит от контекста, где оно использовалось.

Энергия используется для описания меры «информации» при формулировании операции в рамках вероятностной структуры, такой как оценка MAP (максимум априори) в сочетании с марковскими случайными полями. Иногда энергия может быть негативной мерой, которую нужно минимизировать, а иногда это позитивная мера, которую нужно максимизировать.

2 голосов
/ 30 декабря 2010

Если вы считаете, что (для естественных изображений, снятых камерами) свет - это энергия, вы можете назвать энергию значением пикселя в некотором канале.

Однако я считаю, что по энергии книгиссылаясь на спектральную плотность.Из википедии:

Спектральная плотность энергии описывает, как энергия (или дисперсия) сигнала или временного ряда распределяется с частотой

http://en.wikipedia.org/wiki/Spectral_density

1 голос
/ 14 декабря 2015

Я нашел это в книге обработки изображений;

Энергия: S_N = sum (from b=0 to b=L-1) of abs(P(b))^2

P(b) = N(b) / M

, где M представляет общее количество пикселей в окне соседства с центром в (j,k) и N(b)число пикселей амплитуды в одном и том же окне.

Это может дать нам лучшее понимание, если мы увидим это уравнение с энтропией;

Энтропия: S_E = - sum (from b=0 to b=L-1) of P(b)log2{P(b)}

Источник: стр.538 ~ 539 Цифровая обработка изображений, написанная Уильямом К. Праттом (4-е издание)

1 голос
/ 13 января 2015

Алгоритм Змея - метод обработки изображения, используемый для определения контура объекта, змея - это не что иное, как вектор точек (X, Y) с некоторыми ограничениями, его конечная цель - окружить объект и описать его форму (контур), а затем отслеживать или представлять объект по его форме.

Алгоритм имеет два вида энергий, внутреннюю и внешнюю.

Внутренняя энергия (энергия змеи) (IE) представляет собойОпределяемая пользователем энергия, которая воздействует на змею (внутренне), чтобы наложить ограничения на гладкость змеи, без такой силы форма змеи в конечном итоге будет соответствовать точной форме объекта, это не желательно, потому что точная формаобъект очень трудно получить из-за условий освещения, качества изображения, шума и т. д.

Внешняя энергия (EE) возникает из данных (интенсивности изображения), и это не что иное, как абсолютноеразница интенсивностей в направлениях х и у (градиент интенсивности), умноженная на -1, чтобы бытьсуммируется с внутренней энергией, потому что полная энергия должна быть минимизирована.поэтому общая энергия для всей точки змеи должна быть минимизирована. В идеале, это происходит, когда есть ребра, потому что градиент на ребре или (EE) максимизирован, и так как он умножается на -1, общая энергиязмея вокруг ближайшего объекта минимизируется, и, таким образом, алгоритм сходится к решению, которое, как мы надеемся, является истинным контуром исследуемого объекта.

, потому что этот алгоритм основан на EE, которое не только высоко по краям, но ивысоко в шумных точках, иногда алгоритм змеи не сходится к оптимальному решению, поэтому это приблизительный жадный алгоритм.

1 голос
/ 07 июля 2013

Энергия определяется на основе нормализованной гистограммы изображения.Энергия показывает, как распределяются уровни серого.Когда количество серых уровней низкое, тогда энергия высокая.

...