Проблемы с кодировкой символов - UTF-8 / Проблема при передаче данных в Интернете? - PullRequest
0 голосов
/ 21 июля 2011

У меня есть данные, отправляемые со стороны клиента, которые отправляют их следующим образом:

// $booktitle = "Comí habitación bailé"

$xml_obj = new DOMDocument('1.0', 'utf-8');

// node created with booktitle and added to xml_obj 
// NO htmlentities / other transformations done

$returnHeader = drupal_http_request($url, $headers = array("Content-Type:  text/xml; charset=utf-8"), $method = 'POST', $data = $xml_data, $retry = 3);

Когда я получаю их на своем конце (через этот drupal_http_request), и я делаю htmlentities, яполучить следующее:

 Comí habitación bailé

Что при отображении выглядит как бред:

 Comí Habitación Bailé

Что идет не так?


Редактировать 1)

<?php
$title = "Comí habitación bailé";
echo "title=$title\n";
echo 'encoding is '.mb_detect_encoding($title);
$heutf8 = htmlentities($title, ENT_COMPAT, "UTF-8");
echo "heutf8=$heutf8\n";
?>

Запуск этого тестового сценария на компьютере Windows и перенаправление в файл показывает:

title=Comí habitación bailé
encoding is UTF-8heutf8=

Запуск этого в системе Linux:

title=Comí habitación bailé
encoding is UTF-8PHP Warning:  htmlentities(): Invalid multibyte sequence in argument in /home/testaccount/public_html/test2.php on line 5
heutf8=

Ответы [ 3 ]

2 голосов
/ 21 июля 2011

Я думаю, что вы не должны кодировать сущности с htmlentities только для того, чтобы правильно их выводить (вы должны, как указано в комментариях, использовать htmlspecialchars, чтобы избежать межсторонних сценариев), просто установите правильные заголовки и мета-конец отображают значения обычно:

<?php
 header ('Content-type: text/html; charset=utf-8');
 ?>
 <html>
 <head>
 <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
 </head>
 <body>

 </body>
 </html>
0 голосов
/ 21 июля 2011

htmlentities по умолчанию интерпретирует свой ввод как ISO-8859-1; Вы передаете UTF-8 для параметра charset?

0 голосов
/ 21 июля 2011

Попробуйте передать информацию заголовков в формате массива ключ / значение.

Что-то вроде

$headers = array("Content-Type" => "text/xml; charset=utf-8"")

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...