XML содержит странные символы с неизвестной кодировкой - PullRequest
0 голосов
/ 02 мая 2018

Мы получаем экспорт XML-файлов от сторонней компании. Просматривая эти файлы, я заметил несколько странных строк, которые выглядят так, будто xml поврежден в этой части, что делает невозможным импорт или проверку этого xml.

Это изображение показывает одну из этих "поврежденных" частей. enter image description here

Обычно я просто отправляю сообщения сторонней компании и прошу их исправить все, что не так с этими файлами, но мне интересно, что может быть причиной такого "повреждения".

Несколько вещей, которые я заметил:

  • Повреждение повторяется каждые 16280 символов.
  • Это всегда один и тот же «набор» символов в файле, но они могут незначительно отличаться в других файлах.

Файлы были загружены через FTP. Несколько файлов содержат слегка измененную версию поврежденной части. Однако между ними всегда 16280 символов.

Я практически исключил ошибки во время передачи, так как я перезагружал файлы несколько раз.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...