Я пытаюсь преобразовать все & nbsp; экземпляры к обычным пробелам в PHP:
echo '<meta charset="UTF-8" /> ';
echo html_entity_decode(' ');
echo html_entity_decode(' ', ENT_COMPAT, 'UTF-8');
Если первая строка закомментирована, то вывод будет в ISO 8859-1 и будет иметь вид:
Â
Там, где впереди есть место. Если указана кодировка UTF-8, она гласит:
�
Это неопределенный символ UTF-8, за которым следует пробел. Можно ли в любом случае обеспечить правильное декодирование всех пространств сущностей HTML независимо от кодировки?
Символ пробела на самом деле просто пример, и я пытаюсь прочитать html-ввод из неопределенного набора символов и отобразить его. Так что <и <оба станут <. </p>