Как прочитать файл, содержащий шестнадцатеричные символы UTF-8, а затем декодировать символы в шестнадцатеричные числа HTML? - PullRequest
0 голосов
/ 18 января 2011

У меня есть файл, содержащий шестнадцатеричные символы UTF-8, как показано ниже:

<root>
<element>1 \xc3\x97 2 = 2</element>
</root>

Я хочу прочитать файл и преобразовать все символы \xhh в эквивалентные шестнадцатеричные числа HTML, а затем записать в новый файл. Таким образом, для файла с указанным содержимым новый файл должен выглядеть следующим образом:

<root>
<element>1 &#xd7; 2 = 2</element>
</root>

Спасибо!

1 Ответ

2 голосов
/ 18 января 2011

Если вы использовали :utf8 во входном потоке, тогда это исправит данные:

s/([^\x00-\x7F])/sprintf "&#x%x;", ord $1/ge;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...