Спасибо @ collapsar
Вы заставили меня подумать, что моя методология работы с изображениями требует слишком много работы / сложности, так как ссылка является отдельным элементом, требующим построения дерева элементов и выполнения межстрочного многострочного поиска +заменить, поэтому я посмотрел на упрощение проблемы (создание моей собственной методологии).
Новый подход: не используйте поля ссылок для указания РЕАЛЬНОГО пути к изображению, используйте поле «alt =», которое появится на том жестрока как поле "src =", где "href =" может не указывать (вводя сложность).
Новый ввод:
<p class=MsoNormal align=center style='margin-bottom:0in;margin-bottom:.0001pt;
text-align:center'><span lang=EN-CA><img border=0 width=429 height=409
id="Picture 19" src="Tools_files/image001.jpg"
alt="/SecureOffice_Images/PuTTY_Login.jpg"></span></p>
Новый вывод:
<p class=MsoNormal align=center style='margin-bottom:0in;margin-bottom:.0001pt;
text-align:center'><span lang=EN-CA><img border=0 width=429 height=409
id="Picture 19"
src="/SecureOffice_Images/PuTTY_Login.jpg"></span></p>
Перевод Alg:
perl -pi -e 's|src=".*?"||g' $1
sed -i 's/alt=/src=/g' $1
Я пытался (предпочел) sed вместо perl, но не мог обойти жадность: sed -i 's/src=".*?"//g' $1
(Q - возможно с sed?)
Итак, теперь яУ меня есть способ автоматически перейти от MS Word, отфильтрованного HTML, к тому, что требует мой сайт. А пока запустите скрипт перевода вручную. В конечном счете, интегрируйте его с моими сценариями автоматического рендеринга оглавления и создания всплывающих окон.
К вашему сведению: вот сайт: www.rossco.org
С уважением;Билл