Как удалить / преобразовать символы, подобные этим, в разобранном HTML-тексте?
Есть ли какая-либо функция для удаления этого ??
Если вы используете html_entity_decode или аналогичную функцию PHP, проверьте, есть ли параметр для определения набора символов, используемого, например.
html_entity_decode ( string $string [, int $quote_style = ENT_COMPAT [, string $charset = 'UTF-8' ]] )
http://www.php.net/manual/en/function.html-entity-decode.php
UTF-8 будет корректно отображать символы при условии, что источник не странный.
Эти символы обычно соответствуют кодировке, с которой ваш браузер интерпретирует страницу. Вы можете попробовать изменить кодировку с метатегом в <head>, например:
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">