Кажется, я не могу обойти кодировку utf-8.
Итак, я экспортирую контент из базы данных в виде XML-файла utf-8.
Программное обеспечение, в которое я импортирую, довольно строго относится к кодированию символов, поэтому я не могу просто поместить все в теги CDATA.
Есть целая куча странных персонажей, например & rsquo ;, & mdash; & Hellip; уже в данных.
Они не работают в xml и должны быть заменены (обычно просто "цитатой").
В идеале я хотел бы декодировать все символы, а затем использовать htmlspecialchars ($ text, ENT_COMPAT, 'UTF-8', FALSE), чтобы снова их кодировать. Но я не могу найти функцию, которая будет их декодировать. Есть один?
Я начал вручную проходить через каждую сущность с помощью str_replace (), но это превращается в гораздо большую работу, чем я ожидал.
Любая помощь будет спасателем.
Спасибо