У меня была проблема несколько раз при работе над проектами, и я хотел бы знать, есть ли элегантное решение.
Проблема
Я вытаскиваю твиты через XML из твиттера и загружаю их в свою БД, однако при выводе их на экран я получаю следующие символы:
"переехал в Дюссельдорф."
ИЛИ ЖЕ
Тамби & Atilde; & копия; п
и если у меня есть русские иероглифы, я получу много уродливых ящиков на месте.
То, что я хотел бы, это правильные родные акценты, чтобы показать под одной кодировкой. Я думал, что это возможно с UTF-8.
Что я использую
После прочтения в файле XML я делаю следующее для очистки данных:
$data = trim($data);
$data = htmlentities($data);
$data = mysql_real_escape_string($data);
Сортировка моей базы данных: utf8_general_ci
Набор символов веб-страницы: charset = UTF-8
Я думаю, что это может иметь какое-то отношение к сущностям HTML, но я действительно ценю решение, которое работает по всем направлениям в проектах.
Заранее спасибо.