Удаление html-сущностей в разобранном тексте - Php - PullRequest
2 голосов
/ 22 июля 2011

Как удалить / преобразовать символы, подобные этим, в разобранном HTML-тексте?

Есть ли какая-либо функция для удаления этого ??

Ответы [ 2 ]

3 голосов
/ 22 июля 2011

Если вы используете html_entity_decode или аналогичную функцию PHP, проверьте, есть ли параметр для определения набора символов, используемого, например.

html_entity_decode ( string $string [, int $quote_style = ENT_COMPAT [, string $charset = 'UTF-8' ]] )

http://www.php.net/manual/en/function.html-entity-decode.php

UTF-8 будет корректно отображать символы при условии, что источник не странный.

0 голосов
/ 22 июля 2011

Эти символы обычно соответствуют кодировке, с которой ваш браузер интерпретирует страницу. Вы можете попробовать изменить кодировку с метатегом в <head>, например:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
...