Поэтому я пытаюсь разобрать HTML-страницы и ищу абзацы (<p>
), используя get_elements_by_tag_name('p');
Проблема в том, что когда я использую $element->nodeValue
, он возвращает странные символы. Документ сначала загружается в $ html с помощью curl, а затем загружается в DomDocument.
Я уверен, что это связано с кодировками.
Вот пример ответа: "aujourdà € € ™ hui".
Заранее спасибо.