Unicode преобразование символов - PullRequest
0 голосов
/ 23 декабря 2010

Hello Часто мне приходится импортировать xml-файлы с помощью php, но в этих файлах содержатся некоторые странные символы, например: u2022 (соответствует реальному символу), и т. Д. Есть ли в php какая-либо функция для преобразования этих символов в соответствующие им реальные символы (например, \ u2022-> •)?

1 Ответ

2 голосов
/ 25 декабря 2010

Я предполагаю, что вы хотите исправить ошибки в плохо скомпонованном стороннем XML, который вы не можете контролировать.Трудно сказать без реального примера, но \ u2019 - это синтаксис JavaScript для кодирования символов Unicode.Учитывая это, вы можете обрабатывать ввод как строку JavaScript, а не как обычный текст.Функция json_decode () может помочь вам:

<?php

$input = '\u2022 (corresponding to • real char ) , \u2019';
$output = json_decode('"' . $input . '"');

Теперь $output содержит • (corresponding to • real char ) , ’.

...