Многие учебные материалы описывают SSD в целом, не приводя примеров, что является неоднозначным и трудным для понимания.
Я все еще не уверен насчет SSD, он просто вычисляет разницу значений пикселей? Предположим, есть два изображения с некоторыми интересными точками, как работает SSD? В моем понимании вычисляется разница значений пикселей вокруг точек интереса на изображении 1 и изображении 2 в пределах определенного размера окна, а затем суммируется вся разница. Я прав?
Я реализовал SSD, но он не соответствует, независимо от того, как я настраиваю порог.
Если это работает так, как я описал, может возникнуть много проблем:
Интересные точки с похожим рисунком совпадают по ошибке. Как две точки интереса на двух изображениях с большой белой областью, совпадают, но, очевидно, они не являются одним и тем же объектом.
Он плохо работает с повернутыми изображениями, если изображение 2 повернуто на 90 градусов, сумма различий значительно увеличится. Я также реализовал ориентационную гистограмму дескриптора SIFT, как SSD справляется с этим? Как разрешить сопоставление SSD учитывать вращательную инвариантность?
Похоже, что она не является инвариантной по контрасту. Если изображение 2 совпадает с изображением 1, но имеет очень низкую яркость, это приведет к сбою сопоставления, поскольку значения пикселей значительно отличаются, хотя положения пикселей одинаковы.
Будет кто-нибудь привести пример?