Я анализирую сайт, чтобы получить информацию. Я использую curl и xpath с php. В своем исходном коде он написал
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
в начале сайта. Поэтому я думаю, что он использует ISO-8859-1 для своего кода.
Div, который я хочу проанализировать:
<div class="box_title_ficha"><span>50% Dto.</span> Curso on-line de inglés de ABA English por 12,50 € en vez de 24,99 €. ¡Aprende inglés desde cualquier lugar con el método más completo!</div>
Мой код:
$info = trim(strip_tags($xpath->query("//div[@class='box_title_ficha']")->item
(0)->nodeValue)); $info = html_entity_decode($info , ENT_QUOTES, "iso-8859-1");
Я использую эту инструкцию для получения информации. После этого мне нужно сохранить его в базе данных MySQL. Так что мне нужно это закодировать. Но мне не удалось сохранить знак евро. Когда я пытаюсь отобразить это предложение, знак евро исчезает или отображается как блок.
Я пробовал:
htmlentities($info , ENT_QUOTES, "iso-8859-1"); , mb_convert_encoding($info , "ISO-8859-1");
htmlentities(html_entity_decode(utf8_decode($info )), ENT_QUOTES, "iso-8859-1");
все кодировка php htmlentites и все формы, смешанные из этих функций. Никто из них не работал.
Я думаю, что разработчик набрал евро прямо со своей клавиатуры ...
Вот ссылка на сайт, который я анализирую: http://www.aprendum.com/curso-ingles-on-line-p44
У кого-нибудь есть предложения? Большое спасибо.