Автоматически генерировать вложенное оглавление на основе тегов заголовка - PullRequest
2 голосов
/ 06 февраля 2011

Кто из вас, хитрых программистов, может показать мне элегантное php-кодированное решение для автоматической генерации вложенного оглавления на основе тегов заголовка на странице?

Итак, у меня есть HTML-документ, таким образом:

<h1> Animals </h1>

Some content goes here.
Some content goes here.

<h2> Mammals </h2>

Some content goes here.
Some content goes here.

<h3> Terrestrial Mammals </h3>
Some content goes here.
Some content goes here.

<h3> Marine Mammals </h3>
Some content goes here.
Some content goes here.

<h4> Whales </h4>
Some content goes here.
Some content goes here.

В частности, я хочу связанное оглавление в виде вложенного списка ссылок на заголовки на той же странице:

Оглавление (автоматически генерируется кодом PHP)

  1. Животные
    1. Млекопитающие
      1. Наземные млекопитающие
      2. Морские млекопитающие
        1. Киты

Ответы [ 4 ]

7 голосов
/ 06 февраля 2011

Я не нахожу это изящным, но может помочь получить общее представление о том, как его создать;)

Он использует simple_html_dom для поиска и манипулирования элементами в оригинальном html

$htmlcode = <<< EOHTML
<h1> Animals </h1>
Some content goes here.
Some content goes here.
<h2> Mammals </h2>
Some content goes here.
Some content goes here.
<h3> Terrestrial Mammals </h3>
Some content goes here.
Some content goes here.
<h3> Marine Mammals </h3>
Some content goes here.
Some content goes here.
<h4> Whales </h4>
Some content goes here.
Some content goes here.
// simpehtmldom or other dom manipulating library
require_once 'simple_html_dom.php';

$html = str_get_html($htmlcode);

$toc = '';
$last_level = 0;

foreach($html->find('h1,h2,h3,h4,h5,h6') as $h){
    $innerTEXT = trim($h->innertext);
    $id =  str_replace(' ','_',$innerTEXT);
    $h->id= $id; // add id attribute so we can jump to this element
    $level = intval($h->tag[1]);

    if($level > $last_level)
        $toc .= "<ol>";
        $toc .= str_repeat('</li></ol>', $last_level - $level);
        $toc .= '</li>';

    $toc .= "<li><a href='#{$id}'>{$innerTEXT}</a>";

    $last_level = $level;

$toc .= str_repeat('</li></ol>', $last_level);
$html_with_toc = $toc . "<hr>" . $html->save();
6 голосов
/ 06 февраля 2011

Вот пример использования DOMDocument :

$doc = new DOMDocument();

// create document fragment
$frag = $doc->createDocumentFragment();
// create initial list
$head = &$frag->firstChild;
$xpath = new DOMXPath($doc);
$last = 1;

// get all H1, H2, …, H6 elements
foreach ($xpath->query('//*[self::h1 or self::h2 or self::h3 or self::h4 or self::h5 or self::h6]') as $headline) {
    // get level of current headline
    sscanf($headline->tagName, 'h%u', $curr);

    // move head reference if necessary
    if ($curr < $last) {
        // move upwards
        for ($i=$curr; $i<$last; $i++) {
            $head = &$head->parentNode->parentNode;
    } else if ($curr > $last && $head->lastChild) {
        // move downwards and create new lists
        for ($i=$last; $i<$curr; $i++) {
            $head = &$head->lastChild->lastChild;
    $last = $curr;

    // add list item
    $li = $doc->createElement('li');
    $a = $doc->createElement('a', $headline->textContent);

    // build ID
    $levels = array();
    $tmp = &$head;
    // walk subtree up to fragment root node of this subtree
    while (!is_null($tmp) && $tmp != $frag) {
        $levels[] = $tmp->childNodes->length;
        $tmp = &$tmp->parentNode->parentNode;
    $id = 'sect'.implode('.', array_reverse($levels));
    // set destination
    $a->setAttribute('href', '#'.$id);
    // add anchor to headline
    $a = $doc->createElement('a');
    $a->setAttribute('name', $id);
    $a->setAttribute('id', $id);
    $headline->insertBefore($a, $headline->firstChild);

// append fragment to document

// echo markup
echo $doc->saveHTML();
4 голосов
/ 09 февраля 2011

Я нашел этот метод, Алекс Фриман (http://www.10stripe.com/articles/automatically-generate-table-of-contents-php.php):


    //reformat the results to be more usable
    $toc = implode("\n",$resultats[0]);
    $toc = str_replace('<a name="','<a href="#',$toc);
    $toc = str_replace('</a>','',$toc);
    $toc = preg_replace('#<h([4-6])>#','<li class="toc$1">',$toc);
    $toc = preg_replace('#<\/h[4-6]>#','</a></li>',$toc);

    //plug the results into appropriate HTML tags
    $toc = '<div id="toc"> 
    <p id="toc-header">Table des matières</p>
    <hr />
    </div><br /><br />';

    return $toc;

В HTML заголовки должны быть записаны как:

<h2><a name="target"></a>Text</h2>
0 голосов
/ 17 марта 2019

Посмотрите на TOC класс . Это позволяет генерировать оглавление из вложенных заголовков. За тегом h1 может следовать любой тег h нижнего уровня. Класс использует рекурсию для извлечения заголовков из текста статьи
