Поведение при извлечении текста сбивает с толку - PullRequest
0 голосов
/ 04 марта 2019

Работа на ливневом гусеничном ходу 1.13.Я использую приведенный ниже конфиг для извлечения текста.Немного путают с тем, как это будет работать.

   - MAIN[role="main"]
   - DIV[id="content--news"]
   - DIV[id="content--person"]
   - ARTICLE

Каждый раз, когда сканер запускается, он проверяет все теги, включенные в конфигурацию, или пропускает оставшиеся теги, если найдено первое совпадение.

1 Ответ

0 голосов
/ 05 марта 2019

см. JAVADOC

Используется первый соответствующий шаблон включения или весь документ, если выражения не настроены или совпадение не найдено.

Код довольно прост.

...