Я пытаюсь загрузить анализ ответа Google Weather API (ответ на китайском языке).

Здесь - это вызов API.

// This code fails with the following error
$xml = simplexml_load_file('');

(!) Предупреждение: simplexml_load_string () [Function.simplexml-нагрузки строка]: Объект: строка 1: ошибка синтаксического анализатора: вход неверный UTF-8, укажите кодировку ! Байты: 0xB6 0xE0 0xD4 0xC6 in C: \ htdocs \ weather.php в строке 11

Почему загрузка этого ответа не удалась?

Как мне кодировать / декодировать ответ, чтобы simplexml правильно его загружал?

Редактировать: Вот код и вывод.

$googleData = file_get_contents('');
$xml = simplexml_load_string($googleData);

(!) Предупреждение: simplexml_load_string () [Function.simplexml-нагрузки строка]: Объект: строка 1: ошибка синтаксического анализатора: вход неверный UTF-8, укажите кодировку ! Байты: 0xB6 0xE0 0xD4 0xC6 in C: \ htdocs \ test4.php в строке 3 Вызов стек Time Memory Функция Location 1 0.0020 314264 {main} ( ) .. \ test4.php: 0 2 0,1535 317520 simplexml_load_string (строка (1364)) .. \ test4.php: 3

(!) Предупреждение: simplexml_load_string () [Function.simplexml-нагрузки строка]: t_system Данные = "СИ" />

(!) Предупреждение: simplexml_load_string () [function.simplexml-load-string]: ^ in C: \ htdocs \ test4.php в строке 3 Вызов стек Time Memory Функция Location 1 0.0020 314264 {main} ( ) .. \ test4.php: 0 2 0,1535 317520 simplexml_load_string (строка (1364)) .. \ test4.php: 3

Проблема здесь в том, что SimpleXML не смотрит на заголовок HTTP, чтобы определить кодировку символов, используемую в документе, а просто предполагает, что это UTF-8, хотя сервер Google действительно объявляет его как

Content-Type: text/xml; charset=GB2312

Вы можете написать функцию, которая будет смотреть на этот заголовок с помощью сверхсекретной магической переменной $http_response_header и соответствующим образом трансформировать ответ.Примерно так:

function sxe($url)
    $xml = file_get_contents($url);
    foreach ($http_response_header as $header)
        if (preg_match('#^Content-Type: text/xml; charset=(.*)#i', $header, $m))
            switch (strtolower($m[1]))
                case 'utf-8':
                    // do nothing

                case 'iso-8859-1':
                    $xml = utf8_encode($xml);

                    $xml = iconv($m[1], 'utf-8', $xml);

    return simplexml_load_string($xml);
Обновление: Я могу воспроизвести проблему. Кроме того, Firefox автоматически обнаруживает набор символов как «упрощенный китайский», когда я выводлю необработанный XML-канал. Либо канал Google обслуживает неверные данные (китайские упрощенные символы вместо символов UTF-8), либо он обслуживает другие данные, когда они не извлекаются в браузере - в заголовке типа контента в Firefox четко указано utf-8.

Преобразование входящего канала из упрощенного китайского (GB18030, это то, что дал мне Firefox) в UTF-8 работает:

 $incoming = file_get_contents('');
 $xml = iconv("GB18030", "utf-8", $incoming);
 $xml = simplexml_load_string($xml);

это пока не объясняет и не решает основную проблему. У меня нет времени, чтобы сейчас глубоко вникнуть в это, может быть, кто-то еще. Мне кажется, что Google фактически предоставляет неверные данные (что удивило бы меня. Я не знал, что они совершали ошибки, как мы, смертные.: P)

Это скрипт, который я создал в php для разбора Google Weather API.


function sxe($url)
$xml = file_get_contents($url);
foreach ($http_response_header as $header)
if (preg_match('#^Content-Type: text/xml; charset=(.*)#i', $header, $m))
switch (strtolower($m[1]))

case 'utf-8':
// do nothing

case 'iso-8859-1':
$xml = utf8_encode($xml);

$xml = iconv($m[1], 'utf-8', $xml);
return simplexml_load_string($xml);

$xml = simplexml_load_file('');
$information = $xml->xpath("/xml_api_reply/weather/forecast_information");
$current = $xml->xpath("/xml_api_reply/weather/current_conditions");
$forecast = $xml->xpath("/xml_api_reply/weather/forecast_conditions");

print "<br><br><center><div style=\"border: 1px solid; background-color: #dddddd; background-image: url(''); width: 450\">";

print "<br><h3>";
print $information[0]->city['data'] . "&nbsp;" . $information[0]->unit_system['data'] . "&nbsp;" .     $information[0]->postal_code['data'];
print "</h3>";
print "<div style=\"border: 1px solid; width: 320px\">";
print "<table cellpadding=\"5px\"><tr><td><h4>";
print "Now";
print "<br><br>";
print "<img src=" . $current[0]->icon['data'] . ">&nbsp;";
print "</h4></td><td><h4>";
print "<br><br>";
print "&nbsp;" . $current[0]->condition['data'] . "&nbsp;";
print "&nbsp;" . $current[0]->temp_f['data'] . "&nbsp;°F";
print "<br>";
print "&nbsp;" . $current[0]->wind_condition['data'];
print "<br>";
print "&nbsp;" . $current[0]->humidity['data'];
print "<h4></td></tr></table></div>";

print "<table cellpadding=\"5px\"><tr><td>";

print "<table cellpadding=\"5px\"><tr><td><h4>";
print "Today";
print "<br><br>";
print "<img src=" . $forecast[0]->icon['data'] . ">&nbsp;";
print "</h4></td><td><h4>";
print "<br><br>";
print  $forecast[0]->condition['data'];
print "<br>";
print  "High&nbsp;" . $forecast[0]->high['data'] . "&nbsp;°F";
print "<br>";
print  "Low&nbsp;" . $forecast[0]->low['data'] . "&nbsp;°F";
print "</h4></td></tr></table>";

print "<table cellpadding=\"5px\"><tr><td><h4>";
print  $forecast[2]->day_of_week['data'];
print "<br><br>";
print "<img src=" . $forecast[2]->icon['data'] . ">&nbsp;";
print "</h4></td><td><h4>";
print "<br><br>";
print  "&nbsp;" . $forecast[2]->condition['data'];
print "<br>";
print  "&nbsp;High&nbsp;" . $forecast[2]->high['data'] . "&nbsp;°F";
print "<br>";
print  "&nbsp;Low&nbsp;" . $forecast[2]->low['data'] . "&nbsp;°F";
print "</h4></td></tr></table>";

print "</td><td>";

print "<table cellpadding=\"5px\"><tr><td><h4>";
print  $forecast[1]->day_of_week['data'];
print "<br><br>";
print "<img src=" . $forecast[1]->icon['data'] . ">&nbsp;";
print "</h4></td><td><h4>";
print "<br><br>";
print  "&nbsp;" . $forecast[1]->condition['data'];
print "<br>";
print  "&nbsp;High&nbsp;" . $forecast[1]->high['data'] . "&nbsp;°F";
print "<br>";
print  "&nbsp;Low&nbsp;" . $forecast[1]->low['data'] . "&nbsp;°F";
print "</h4></td></tr></table>";

print "<table cellpadding=\"5px\"><tr><td><h4>";
print  $forecast[3]->day_of_week['data'];
print "<br><br>";
print "<img src=" . $forecast[3]->icon['data'] . ">&nbsp;";
print "</h4></td><td><h4>";
print "<br><br>";
print  "&nbsp;" . $forecast[3]->condition['data'];
print "<br>";
print  "&nbsp;High&nbsp;" . $forecast[3]->high['data'] . "&nbsp;°F";
print "<br>";
print  "&nbsp;Low&nbsp;" . $forecast[3]->low['data'] . "&nbsp;°F";
print "</h4></td></tr></table>";

print "</td></tr></table>";

print "</div></center>";

Просто наткнулся на это.Кажется, это работает (сама функция, которую я нашел в сети, только что обновила):

header('Content-Type: text/html; charset=utf-8'); 

function getWeather() {

$requestAddress = "";
// Downloads weather data based on location.
$xml_str = file_get_contents($requestAddress,0);
$xml_str = preg_replace("/(<\/?)(\w+):([^>]*>)/", "$1$2$3", $xml_str); 

$xml_str = iconv("GB18030", "utf-8", $xml_str);

// Parses XML
$xml = new SimplexmlElement($xml_str, TRUE);
// Loops XML
$count = 0;
echo '<div id="weather">';

foreach($xml->weather as $item) {

    foreach($item->forecast_conditions as $new) {

        echo "<div class=\"weatherIcon\">\n";
         echo "<img src='" .$new->icon['data'] . "'   alt='".$new->condition['data']."'/><br>\n";
        echo "<b>".$new->day_of_week['data']."</b><br>";
        echo "Low: ".$new->low['data']." &nbsp;High: ".$new->high['data']."<br>";
        echo "\n</div>\n";


echo '</div>';

Попробуйте добавить в URL параметр запроса eo = utf-8.В этом случае ответом будет исключительно кодировка UTF-8.Это помогло мне.