Де-дуппинг куча файлов MP4 - PullRequest
0 голосов
/ 25 января 2020

У меня есть два набора видеофайлов MP4, каждый около 500 файлов. Размер файлов от 500 МБ до 1 ГБ. Я точно знаю, что между наборами есть дубликаты файлов. Проблема в том, что из-за тегов xmpmeta файлы НЕ имеют одинаковую длину и, конечно, имеют разные хэши. Например,

In one set all files have <x:xmpmeta keyword="123"></x:xmpmeta> data at the end
In another set all files have <x:xmpmeta keyword="1234"></x:xmpmeta>  data at the end

Вопрос - как я могу сравнивать и дешифровать файлы, игнорируя метаданные XMP? Мое предпочтительное окружение. NET core / C#

...