CGI::unescapeHTML("渣打银")
=> "渣打 \ 351 \ 223 \ 266"
CGI::unescapeHTML("渣打银 ")
=> "渣打 银"
Добавление пробела в конце имеет значение, иначе последний символ теряется, и я получаю эту странную последовательность символов. Я сталкиваюсь с этой самой проблемой, когда пытаюсь очистить веб-сайты данных, используя кодировку utf-8. Это верно даже для обычного английского текста.