Я получаю документ, который претендует на UTF-8 (<?xml version="1.0" encoding="UTF-8"?>
).В прошлом у меня были некоторые проблемы, когда декларация кодирования от отправителя не была настолько надежной (т. Е. Документы объявлялись с заданной кодировкой, хотя на самом деле их нет), поэтому я пытаюсь проверить, используя http://utf8checker.codeplex.com/ Согласно этому инструменту, байт 0xF8 означает, что этот документ не имеет кодировки UTF-8.
Однако, наоборот, на этой странице перечисляется норвежский символ 'ø', представленный в UTF-8 как 0xF8.(Страница на норвежском, однако, данные, на которые я ссылаюсь, основаны на таблице внизу страницы.)
Может кто-нибудь помочь мне разобраться?Я чувствую себя довольно смущенным здесь.
Спасибо!