У меня есть куча HTML-файлов, и я хочу найти в каждом HTML-файле ключевое слово «From Argumbay» и изменить его на несколько ссылок, которые у меня есть.
Сначала я подумал, что это очень просто, поэтому я открыл каждый HTML-файл и загрузил его содержимое в массив (список), затем посмотрел каждое ключевое слово, заменил его на s /// и выгрузил содержимое в файл, в чем проблема? иногда ключевое слово может также появляться в href, что в данном случае я не хочу, чтобы оно было заменено, или оно может появляться внутри некоторых тегов и тому подобного.
ПРИМЕР: http://www.astrosociety.org/education/surf.html
Я бы хотел, чтобы мой сценарий заменял каждое вхождение слова «здесь» на некоторый href, который у меня есть в $ href, но, как вы можете видеть, есть еще один «здесь», который уже есть в href, я не хочу это еще раз.
В этом случае здесь нет никаких дополнительных 'кроме как от href, но давайте предположим, что есть.
Я хочу заменить ключевое слово только в том случае, если это просто текст, есть идеи?
BOUUNTY EDIT: Привет, я полагаю, что это простая вещь, но похоже, что он стирает все комментарии, найденные в файле HTML, SHTML (главная проблема заключается в том, что он стирает SSI в SHTML), я попытался использовать: store_comments (1 ) метод в $ html перед вызовом рекурсивной функции, но безрезультатно. Есть идеи, что мне здесь не хватает?