Я пытаюсь сделать акцентированную замену символов в PHP, но получаю странные результаты, я предполагаю, потому что я использую строку UTF-8, а str_replace не может правильно обрабатывать многобайтовые строки ..
$accents_search = array('á','à','â','ã','ª','ä','å','Á','À','Â','Ã','Ä','é','è',
'ê','ë','É','È','Ê','Ë','í','ì','î','ï','Í','Ì','Î','Ï','œ','ò','ó','ô','õ','º','ø',
'Ø','Ó','Ò','Ô','Õ','ú','ù','û','Ú','Ù','Û','ç','Ç','Ñ','ñ');
$accents_replace = array('a','a','a','a','a','a','a','A','A','A','A','A','e','e',
'e','e','E','E','E','E','i','i','i','i','I','I','I','I','oe','o','o','o','o','o','o',
'O','O','O','O','O','u','u','u','U','U','U','c','C','N','n');
$str = str_replace($accents_search, $accents_replace, $str);
Результаты, которые я получаю:
Ørjan Nilsen -> �orjan Nilsen
Ожидаемый результат:
Ørjan Nilsen -> Orjan Nilsen
Редактировать: мой внутренний обработчик символов установлен в UTF-8 (согласно mb_internal_encoding ()), также значение $ str равно UTF-8, поэтому, насколько я могу судить, все задействованные строки являются UTF -8. Обнаруживает ли str_replace () наборы символов и правильно ли их использует?