У меня есть строка символов, которая содержит данные в кодировке UTF-8 в виде простого текста. Пример
utf8 = "#C2#BD"
Я пытаюсь получить символ для этого значения. В этом случае это будет "½
"
Если бы это было закодировано с использованием UTF-16, это было бы "00BD", я мог бы преобразовать это в символ, который фактически закодирован в utf8, выполнив
intToUtf8(strtoi('0x00BD'))
[1] "½"
Однако я не могу найти способ получить целочисленное значение, используя закодированный в utf8 шестнадцатеричный "# C2 # BD".
В конечном итоге я хочу достичь ½
из "# C2 # BD". Я подозреваю, что путь идет от получения UTF-16, который можно преобразовать в целое число по strtoi
, но мне трудно понять взаимосвязь между ними.