Как обнаружить дубликаты файлов wmf в файле docx - PullRequest
1 голос
/ 26 марта 2020

Существует файл docx, который содержит некоторые повторяющиеся математические уравнения. Если сохранить его как файл html с Office, эти уравнения можно преобразовать в файлы png, а дублированные уравнения преобразовать только в один файл png.

Теперь я хочу обнаружить дублирующиеся уравнения, используя open xml sdk 2.5, в настоящее время я могу получить имена файлов wmf (соответствующие этим уравнениям, используя ImagePart.Uri.OriginalString), но не могу найти равенство.

Я также попробовал метод , проверьте контрольную сумму каждого ImageData, для большинства уравнений это работает; но для простых уравнений типа "(" и ")" контрольная сумма одинакова.

Я также пытался сравнить поток двух файлов wmf (соответствующих уравнениям), но он покажет разницу даже в двух завершите те же уравнения.

...