Преобразование из \ unnnn в буквы - PullRequest
4 голосов
/ 21 декабря 2011

У меня есть файл с такими письмами

\u0410\u0411\u0426

Я хочу преобразовать их во что-нибудь читаемое, например, \u0410\u0411\u0426 означает АБЦ

, но я не знаючто-нибудь о том, почему A хранится как \u0410 или почему Б хранится как \u0411.как я могу сделать преобразование между этими двумя?

Ответы [ 2 ]

4 голосов
/ 21 декабря 2011
$ echo -e '\u0410\u0411\u0426'
АБЦ
$ printf '\u0410\u0411\u0426'
АБЦ
$ python3 -c 'print("\u0410\u0411\u0426")'
АБЦ
$ echo '\u0410\u0411\u0426' | ascii2uni -qaU
АБЦ
1 голос
/ 21 декабря 2011
#irb -E binary
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426"
 => "\u0410\u0411\u0426" 

#irb -E utf-8
ruby-1.9.3-p0 :001 > s="\u0410\u0411\u0426"
 => "АБЦ"

Вы должны прочитать кое-что о кодировках символов, Юникод и UTF-8

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...