Я пытаюсь загрузить мета-описание этого веб-сайта (с немецким символом) через следующий скрипт на PHP:
$page_content = file_get_contents($uri);
$dom_obj = new \DOMDocument();
$dom_obj->loadHTML(mb_convert_encoding($page_content, 'HTML-ENTITIES', 'UTF-8'));
Однако, пытаясь записать его в базу данных MySQL, Ларавел говорит, что столкнулся с проблемами, пытаясь записать это в строковое значение db: неправильное "\ xC3" (которое является немецким символом)
Когда я просто делаю следующее, запись в БД работает. Но символ отображается неправильно (ü вместо ü)
$dom_obj->loadHTML($page_content)
Эта проблема возникает только с этим сайтом, другие, которые я пробовал с тем же персонажем, работают Можете ли вы придумать возможную причину и исправить? Спасибо!
Edit:
Это прекрасно работает, когда я использую PHP "utf8_decode" для декодирования мета-описания, которое я получаю через $ dom_obj без mb_convert_encoding. Когда я делаю это, все другие сайты, которые работали раньше, приводят к ошибкам (например, это: Неверное строковое значение: '\ xE4t')