Два файла .DOCX - одинаковые, но разные - PullRequest
0 голосов
/ 06 декабря 2011

Фон

У нас есть приложение, которое отслеживает входящие сообщения электронной почты и принимает электронные письма и их вложения, а также включает в себя сторонний инструмент под названием ImageMAKER (http://www.imgmaker.com/) для файлов .TIFF из них. Этот процесс прекрасно работает в большинстве случаев. время. Однако мы получим вложения .DOCX с этой ошибкой из процесса. Если мы возьмем исходный файл, откроем его и сохраним его снова (без изменений), размер файла изменится, и процесс будет успешно обработан это когда мы помещаем его обратно в систему. Это тот случай, когда мы переименовываем его и сохраняем в том же каталоге, что и оригинал, или сохраняем оригинальное имя и сохраняем его в другом каталоге. Эти два файла визуально идентичны при просмотре в Microsoft Слово.

Пока найдено

Для устранения неполадок мы изменили расширения как исходного, так и сохраненного файлов на .ZIP, сравнили файл «docProps \ app.xml» каждого и обнаружили странные различия. В этом конкретном примере документ представлял собой 10-страничный файл .DOCX. Однако в файле app.xml исходного файла указано, что это 2 страницы, а в файлах, которые мы сохраняем из исходного, - 10. Слова, символы и строки также отключены.

Подобные документы, похоже, исходят от конкретного клиента больше, чем от кого-либо еще, но мы получаем от них больше хороших документов, чем плохих. Предполагая, что исходный файл app.xml не был подделан до того, как нам был отправлен файл .DOCX, кто-нибудь знает, что может вызвать это? Я уверен, что в конечном итоге нам нужно будет связаться с клиентом, но нам понадобятся боеприпасы, когда они ответят: «Мы не делаем ничего плохого с нашей стороны».

EDIT:

Они также приходят от других клиентов.

app.xml из исходного файла original file

app.xml из сохраненного файла resaved file

Заранее спасибо!

...