Файлы мультимедиа могут иметь разную кодировку и битрейт, но все они по сути могут относиться к «одному и тому же».Существует ли алгоритм (или несколько для разных форматов) для генерации контрольной суммы, которая будет эквивалентна для этих файлов?
Или есть что-то более продвинутое, когда различные биты контрольной суммы меняются, чтобы отразить большее изменение между файлами?Например, крайние левые биты в контрольной сумме будут более устойчивы к изменениям, т. Е. Для двух медиафайлов, которые будут иметь разные крайние левые биты, их содержимое должно быть очень разным, а крайние правые биты очень склонны к изменению, то есть небольшие различия будутизмените самые правые биты.
Я знаю, что вы можете использовать метаданные для идентификации медиа-контента, но это может быть ненадежным и непоследовательным для всех медиа-файлов и часто даже не присутствует.