Для большинства (всех?) Целей изучение метрик является подмножеством обучения сходству.Обратите внимание, что в общем использовании «подобное» примерно равно «расстоянию»: вещи с небольшим расстоянием между ними имеют высокое сходство.На практике это обычно вопрос семантического выбора - непрерывное преобразование может вообще сделать два изоморфных.
Метрика должна следовать определенным правилам;функция подобия имеет более слабые стандарты.Например, сравните полнометражный (скажем, 2 часа) фильм M
с 20-минутным анимационным сокращением A
.Метрическая функция f
требует, чтобы f(M, A) = f(A, M)
.Однако, если вы решите, что богатство фильма означает, что он не должен рассматривать мультфильм как такой близкий родственник, вы можете ввести пару обучающих троек
(A, M, 0.90)
(M, A, 0.15)
Другой пример был бы с заданным сходством:измеряется по размеру и членству, но неевклидово.
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
c = {5, 6, 7, 8}
Обучение подобию позволит
(a, b, 2)
(b, c, 2)
(a, c, 10)
В этом "мире", a
и c
понести большой штраф, потому что они не имеют ничего общего, кроме установленного размера.b
близок к каждому из них из-за того, что имеет половину общих элементов.Это вызвало бы метрическую функцию головной боли, поскольку она серьезно нарушает subaddition
, неравенство треугольника.
Помогает ли это устранить различия?