Вы не привели ни одного примера изображений, но даже в этом случае я не уверен, что использование таких точек функций, как orb или Kaze / Akaze, было бы хорошей идеей. Те более или менее все еще обнаруживают угловые точки, когда сравнение сигнатур с некоторой степенью точности, похоже, требует гораздо больше знаний (кривизна и т. Д. c). Это похоже на то, что простая сверточная сеть будет хороша. Я думаю, что вы можете использовать, например, такую архитектуру:
signature --> Convnet --> head-1 --> signature embedding ------>---
| |---> (Hinge) loss
| |
--> head-2 --> signtature embedding ---->----
, где потеря вынуждает встраивание похожих подписей быть близко, а встраивание несходных - дальше друг от друга.
Вы могли бы построить свою архитектуру на этой несколько старой бумаге . Что касается данных для обучения вашей сети, существует множество наборов данных (например, посмотрите эту ссылку kaggle ).
EDIT : поскольку вы говорите в своем комментарии что вы предпочитаете избегать подходов, основанных на глубоком обучении, я думаю, было бы полезно посмотреть, чего не хватает вашему текущему подходу с точки зрения функций.
Низкоуровневые функции, которые вы извлекаете (не извлекайте ORB, он разработан, чтобы быть быстрым, а не точным, придерживайтесь KAZE или AKAZE, если можете) захватывать локальную информацию, но для распознавания подписей важно то, как они пространственно распределены (распределение должно быть примерно одинаковым в аналогичных подписях). Это может быть решено одним или обоими этими вещами: 1) Измените способ оценки сходства, чтобы включить пространственное распределение вместо того, чтобы просто полагаться на количество общих точек характеристик 2) Разработайте вручную дополнительный элемент высокого уровня, который фиксирует глобальные аспекты подписей (это может быть простое соотношение высоты / ширины или более сложное с учетом кривизны и т. д. c).