Похоже, что для этого конкретного автора текст был отредактирован в каком-то редакторе, который предполагал, что это не UTF8, а затем переписал его в UTF8. Я основываюсь на том факте, что если я скажу своему браузеру интерпретировать страницу как различные общие кодировки, ни одна из них не заставит ее отображаться правильно. Это говорит мне о том, что какое-то преобразование было сделано в какой-то момент неправильно.
Единственная проблема с UTF8 заключается в том, что не существует стандартизированного способа распознать, что файл является UTF8, и пока все редакторы не стандартизируют UTF8, все равно будут возникать ошибки преобразования. Для других вариантов Unicode метка порядка байтов (BOM) является довольно стандартной, чтобы помочь идентифицировать файл, но спецификации в файлах UTF8 довольно редки.
Чтобы он не отображался в вашем контенте, убедитесь, что вы всегда используете редакторы с поддержкой юникода, и всегда открывайте файлы с правильными кодировками. К сожалению, это боль, и иногда случаются ошибки. Ключ просто ловит их пораньше, чтобы вы могли отменить его или сделать несколько правок.