Как извлечь заголовки страницы с помощью PHP (в частности, WordPress) - PullRequest
2 голосов
/ 24 декабря 2011

Можно ли с помощью PHP извлечь заголовки (h1, h2 и т. Д.) Со страницы, используя PHP, и поместить их на той же странице в неупорядоченный список? Хорошо подходит решение для WordPress, но приветствуется и общее решение PHP.

РЕДАКТИРОВАТЬ: я хочу что-то вроде

h1
  h2
    h3
    h3
  h2
    h3
    h3

1 Ответ

3 голосов
/ 24 декабря 2011

В php вы можете использовать xml-манипуляции:

http://www.php.net/manual/en/domdocument.getelementsbytagname.php

Еще не тестировали, но что-то подобное для h1:

$dom = new DOMDocument();

@$dom->loadHTML(file_get_contents('htmlfile.htm'))

$h1 = $dom->getElementsByTagName('h1');

foreach ( $h1 as $val ){
    echo $val->property->__toString();
}

IЯ не совсем уверен в функциях, и я не смогу проверить (до, вероятно, завтра) ... Я получил tostring от http://br.php.net/manual/en/class.domelement.php#98851

...