Как получить заголовок веб-страницы с CURL в PHP с сайтов разных CHARSET? - PullRequest
1 голос
/ 13 декабря 2010

Я хочу сохранить заголовок в UTF — 8 ,, но на страницах есть много разных кодировок, таких как GBK, ISO, Unicode ……

Не могли бы вы мне помочь? 1003 *

Спасибо.

1 Ответ

1 голос
/ 13 декабря 2010

Идентификация или обнаружение кодировки символов и преобразование данных в UTF-8 при необходимости.

Для HTML (т.е. text / html) существует три способа указать кодировку :

  1. HTTP-параметр "charset" в поле "Content-Type".
  2. A META объявление с http-эквивалентным значением «Content-Type» и значением, установленным для «charset».
  3. Атрибут charset установлен для элемента, который обозначает внешний ресурс.

Если ни один из них не присутствует, вы можете сделать анализ содержимого или переключиться на некоторую кодировку символов по умолчанию (например, ISO 8859-1).

Если идентифицированная / обнаруженная кодировка символов не является UTF-8, вы можете затем преобразовать данные в UTF-8 с помощью iconv или mb_convert_encoding.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...