Примечание: входной HTML является доверенным; это не определено пользователем!
Я выделю то, что мне нужно, на примере.
С учетом следующего HTML:
<p>
Welcome to <a href="http://google.com/" class="crap">Google.com</a>!<br>
Please, <a href="enjoy.html">enjoy</a> your stay!
</p>
Я хотел бы преобразовать его в:
Welcome to Google.com[1]
Please, enjoy[2] your stay!
[1] http://google.com/
[2] %request-uri%/enjoy.html <- note, request uri is something I define
for relative paths
Я бы хотел иметь возможность настроить его.
Редактировать: На следующей заметке я лучше объясню себя и свои причины
У нас есть автоматизированная система шаблонов (с таблицами таблиц!) Для электронных писем, и как часть системы я хотел бы создавать составные электронные письма, т. Е. Содержащие как HTML, так и TEXT.
Система предназначена только для предоставления HTML.
Мне нужно осмысленно преобразовать этот HTML в текст, например, я бы хотел как-то сохранить любые ссылки и изображения, возможно, в формате, который я указал выше.