Cloud Vision дает вам процент совпадения с «ярлыком», а не с конкретным изображением.
Не существует универсального показателя сходства между двумя изображениями.Каждый другой алгоритм вычисления подобия использует формулу, которая, как они думали, будет работать лучше всего для их личных потребностей.
Когда я использовал Could Vision, чтобы найти наиболее похожее изображение из набора, вероятно, формула, которую я использовал в конце, была
https://drive.google.com/file/d/0B3BLwu7Vb2U-SVhKYWVMR2JvOFk/view?usp=sharing
Но когда мне нужно сопоставить скорее по визуальному сходству, чем по меткам, я использую свой драгоценный камень для алгоритма хеширования восприятия IDHash https://github.com/Nakilon/dhash-vips