Итак, у меня есть сайт, использующий кодировку ISO-8859-1, и я не могу это изменить. Я хочу быть уверенным, что содержимое, которое я ввожу в веб-приложение на сайте, будет правильно проанализировано. Парсер работает на символьной основе. Я также не могу изменить парсер, я просто пишу файлы для его обработки. Содержимое в моем файле, которое я сообщаю приложению для отображения после синтаксического анализа, содержит символы Unicode (или, по крайней мере, я так полагаю, даже если они были созданы альтернативными кодами Windows, сопоставленными с CP437). Использование сущностей не вариант из-за посимвольной операции парсера. Единственные символы, которые синтаксический анализатор экранирует при выводе, - это чувствительные к разметке символы, такие как амперсанд, меньше и больше символов. Я бы просто пошел дальше и изложил это, чтобы увидеть, как это выглядит, но результаты можно увидеть только в публикации, которая должна потратить пару дней, чтобы получить одобрение и тому подобное, и это потребовало бы слишком много всего лишь для теста. .
Итак, если коротко, если я скажу сайту выводить ▼ ÇÑ ¥ ☺☻ на сайт с метатегом, указывающим, что он должен использовать ISO-8859-1, браузер автоматически обнаружит Unicode и отобразит это или он буквально переведет его как ISO-8859-1 и получит другой набор символов?
ОБНОВЛЕНИЕ: Я сделал временный тестовый сайт в http://doorstop.csh.rit.edu/home/testing, где я сделал тестовый файл в Notepad ++, используя UTF-8 без спецификации, но использовал метатег, который устанавливает кодировку ISO-8859-1.