Я ищу любой совет о том, как я могу обучить модель, чтобы отличить фотографию реального объекта от фотографии изображения объекта. В частности, когда речь идет о кредитных картах и водительских правах.

Например, в Google pay и аналогичных платных приложениях вы можете добавить кредитную карту с помощью камеры. Но оказывается, что он не может сказать, делаю ли я фотографию моей настоящей карты или фотографию изображения моей карты на экране. Для моего приложения мне нужно сделать что-то подобное, но я могу сказать, реально это или нет.
Причина в том, что пользователи иногда пытаются выдать чужую личность за свою собственную (т.е. у них есть фотография чьей-то карты), и с помощью приложения делает фотографию этой фотографии (вы не можете загрузить фотографию в приложение , только сделай живое фото).
Я также ищу успешные реализации, которые уже существуют, чтобы изучить их. Я ничего не мог найти, возможно, потому, что большая часть его проприетарна и не рекламируется.
Первый шаг, который я планирую сделать, это, конечно, создание набора данных, который довольно трудоемок. Это означает, что вы должны распечатать поддельные карточки на пластиковую, а затем сфотографировать их. Модель, к которой я стремлюсь, должна быть в состоянии классифицировать (1) фактическую карту (2) изображение карты на экране (3) изображение карты на бумаге (распечатано / фотокопия). Это кажется возможным, потому что большинство людей могут различить разницу (от яркого света на экране, текстуры бумаги и т. Д.). Обратите внимание, что карта выпущена из одного и того же объекта (тот же логотип, цвет и т. Д.), Поэтому многое должно быть постоянным.
Любые другие предложения, не относящиеся к ML, приветствуются.
Ceci n'est pas une pipe