Немного опоздал в игре, но, возможно, это кому-то поможет ...
Возможно, проблема в выходных данных, а не в самом объекте dom / xpath.
Если вы выведете nodeValue напрямую, вы получите поврежденные символы, например ::10000*
ìÂÂì ë¹Â디ì¤
ìì ë¹ë””ì¤ í°ì íì¤
Вы должны загрузить свой объект dom вторым параметром "utf-8", new \DomDocument('1.0', 'utf-8')
, но при печати значения списка / элемента узла dom вы получите неработающие символы:
echo $contentItem->item($index)->nodeValue
Вы должны обернуть его с помощью utf8_decode:
echo utf8_decode($contentItem->item($index)->nodeValue)
//output: 者不終朝而會,愚者可浹旬而學