У меня есть веб-приложение на основе Java / XML / XSL, которое берет документ XML из другой службы, и затем мы отображаем основной текстовый режим.
На обоих сайтах отображается один и тот же блок текста (который может включать форматирование HTML, английский / французский). Основной сайт отображается нормально, но мой сайт отображает некоторые символы неправильно. Все содержимое, включая французские символы, отображается правильно, кроме этих немногих.
Проверка документа. Я вижу, что A0, B7 не отображаются правильно.
При поиске на этом сайте я нашел этот вопрос / ответ:
Является ли ED A0 80 ED B0 80 действительной последовательностью байтов UTF-8?
В принятом ответе требуется, чтобы нелегальный UTF-8 интерпретировался как Windows-1252. Те персонажи, которых он показывает, это те, кого я вижу.
Насколько я знаю, документ поступает на мой сайт UTF-8 (из веб-приложения на основе .NET, если это имеет значение), и мы сохраняем его как таковой и отображаем как таковой. Он хранится в виде документа XML и преобразуется для отображения выходных данных.
Блок отображается с отключением-выводом-экранированием (так, чтобы отображалось форматирование HTML), и это, похоже, работает правильно.
В идеале я должен был бы отображать эти символы так, как они были задуманы (A0 - это пробел), чтобы мой вывод выглядел так же, как родительский сайт.
Любая помощь или совет приветствуется.