Странный символ в XML-документе - PullRequest
0 голосов
/ 11 ноября 2010

У меня странный персонаж, который появляется в моей ленте новостей.В Firefox это выглядит как прямоугольник с четырьмя числами в каждом углу, в некоторых случаях 0 - 0 - 9 - 4, в других 0 - 0 - 9 - 2.

Они появляются там, где умные кавычки должныбыть.

Я знаком с черным бриллиантом со знаком вопроса, но это новый.

Ответы [ 2 ]

3 голосов
/ 11 ноября 2010

0-0-9-4 указывает, что символ был 0x0094, который является неназначенным символом UTF-16.Все, что создает канал - это вставка символов, для которых в вашем браузере нет сопоставления шрифтов, или, возможно, кодировка символов, указанная в заголовке, не соответствует содержимому потока.

0 голосов
/ 11 ноября 2010

Ах, хорошо. Ты указал мне в правильном направлении. То, что подходило, было объектами Windows. Люди помещают вещи в нашу базу данных, выполняя сложную последовательность шагов, преобразовывая из Word в InDesign в GoLive (да, это больно).

В любом случае, база данных выглядела так: «», что означает что-то для окон, но ничего для моего браузера, ни в ISO-8859-1, ни в UTF-8, так что никаких изменений моя кодировка страницы может исправить эту чепуху. Хотя, как ни странно, он просто появился здесь правильно, поэтому я не знаю, что я делаю не так.

Так или иначе, я исправил это, выполнив все через эту функцию php прежде, чем отобразить это.

function fixChars($text){

    // Next, replace their Windows-1252 equivalents.
    $text = str_replace(
    array('‘', '’', '“', '”', '•', '—', '…'),
    array("'", "'", '"', '"', '-', '--', '...'),
    $text); 

    return $text;

}

Итак, теперь все выглядит хорошо.

Спасибо за направление всем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...