Я читаю в формате HTML из файла и отображаю его на веб-странице:
Когда я смотрю на источник, я вижу:
The Club’s summer junior programs
но это выглядит как:
The Club�s summer junior program
Что здесь происходит и почему появляется �?
�
Вы установили правильную кодировку HTML-страницы?
Читайте здесь и здесь .
Я предполагаю, что вы (или кто-то из ваших близких) копирует / вставляет из Word, и вы наблюдаете веб-эффекты умных цитат Word. Обходной путь - установить кодировку символов в utf-8 или windows-1252.
Может быть, вы скопировали текст из рабочего редактора, такого как MS Word, который изменяет кавычки, чтобы открывать кавычки и закрытые кавычки. Когда такой текст копируется в текстовый файл, возникают следующие проблемы.
Простым решением может быть ввод этих цитат снова в текстовом редакторе.
Очень интересное прочтение Джоэла: http://www.joelonsoftware.com/articles/Unicode.html на эту тему, безусловно, необходимо прочитать, если вы еще не читали это.
Это довольно хорошо объясняет, почему эти проблемы возникают, как они возникли и как их избежать:).
Это определенно проблема кодировки символов. Это означает, что на странице написано, что она имеет X-кодировку, но на самом деле она имеет Y.