У меня есть строка ввода «pythön!»
Если я использую кодировку utf8 онлайн здесь я получаю:
\ x70 \ x79 \ x74 \ x68 \ xC3 \ xB6 \ x6E \ x21
, если я сделаю его строкой и напечатаю:
print("\x70\x79\x74\x68\xC3\xB6\x6E\x21")
Я получаю: pyth├╢n!
Когда я делаю utf8 кодирование с использованием библиотеки utf8 в Lua, например:
c = b:gsub(".",function(s) print(s) return utf8.char(s:byte()) end)
print (c) выводит: pyth┬ön!
Почему эти 2 разные? Также я проверил коды для c:
for p,c in utf8.codes(c) do print(p,string.format("%X",c)) end
Что возвращает:
1 70
2 79
3 74
4 68
5 94
7 6E
8 21
Код # 5 отличается, а # 6 отсутствует. Почему это происходит?