Красный разбор с перерывом - PullRequest
0 голосов
/ 30 апреля 2018

мой код разбора с разрывом не работает, я не должен получить последний блок div в тексте:

src: {
<div class="main">
    <div>
        test
    </div>

    <div>
        test2
    </div>
    <div>
        test3
    </div>
</div>

<div class="test">
</div>
}

rules: [
    (div-count: 0)
    some [
        to "<div"
        (div-count: div-count + 1) [if (div-count = 1) mark1:] 
        |
        thru "</div>"
        (div-count: div-count - 1) [if (div-count = 0) mark2: break]
    ]

    text: copy/part mark1 mark2

]

parse src rules
print text

Ожидаемый результат, который я хочу:

    {
    <div class="main">
        <div>
            test
        </div>

        <div>
            test2
        </div>
        <div>
            test3
        </div>
    </div>
    }

Ответы [ 2 ]

0 голосов
/ 06 мая 2018

Вот альтернативный параметризованный способ его анализа:

div: ["<div" 4 skip some ["</div>" break | div | skip] | skip]
div-rule: [to "<div" div]

n: 1
parse src compose [(n - 1) div-rule copy text div-rule to end]

С n: 1 он извлечет первый корень <div>, с n: 2, второй и так далее. Также должна быть возможность параметризовать вложенные правила для извлечения произвольных <div> разделов.

0 голосов
/ 30 апреля 2018

Ответ для Красного и Ребола может выглядеть следующим образом

rules: [
    (div-count: 0   clear rules/3/8 )
    some [
        mark:  "<div"  
        (if  equal? 1  div-count: div-count + 1  [
            mark1:  mark  
        ] )   | 
         "</div>"  mark2:
        ( 
        if equal? 0  div-count: div-count - 1  [
            text: copy/part mark1 mark2    
            insert rules/3/8 [to end]  
        ]  )  
        [] | skip
    ]
]

Одна из проблем с вашими правилами состоит в том, что вы используете to и | (имеется в виду или) thru, так что большинство закрывающих </div> s будет быть пропущенным Первое совпадение <div выполняется и до следующего открытия <div без сравнения следующих подправил. Но курсор не движется, следующий <div остается прежним. Вероятно, красный обнаруживает бесконечный цикл (без продвижения) и прерывает его.

Я использую динамически измененные правила вместо break, так как break нарушает (под) правила в Rebol, но не останавливает весь процесс синтаксического анализа, как вы можете видеть здесь.

 >> parse "aaa" [(n: 0)some ["a" [break] (ask form n: n + 1) ]]
 1
 2
 3
 == true

Это отличается от Red, где он прерывает синтаксический анализ.

>> parse "aaa" [(n: 0)some ["a" [break] (ask form n: n + 1) ]]
1
== false

Таким образом, простое решение, подходящее для Red, а не для Rebol, может выглядеть так

rules: [
    (div-count: 0)
    some [
        mark: "<div"
        (if  equal? 1  div-count: div-count + 1  [mark1:  mark]) 
        |
        "</div>" mark2:
        if (equal? 0  div-count: div-count - 1 )  
          [(print text: copy/part mark1 mark2 )  break]
        |
        skip
    ]
]
...