Запрос относительно Иерихона HTML Parser - PullRequest
1 голос
/ 09 июля 2011

Я хочу определить номер позиции вхождения определенного текста H2 (или h3 / h4 / h5 / h6) в основной текст, используя Parser. Под номером позиции я подразумеваю подсчет количества «слов», которые встречались до этой конкретной фразы h2 (или h3 / h4 / h5 / h6) ... Также, если фраза встречается в тексте h2 и h4 (например), то как мне убедиться, что я получаю правильный номер позиции для обоих этих текстов?

1 Ответ

1 голос
/ 30 августа 2011

Нет простого способа выполнить такое нестандартное требование.

Вы должны найти теги, найти в них текст, запомнить их положение, проанализировать все до и считать слова.Это не ракетостроение, но на кодирование и тестирование может потребоваться некоторое время.

...