Мне нужно получить значение всех атрибутов title в html-странице.
Я использую шаблоны веток, поэтому исходный код может быть таким:
<a href="#" title="some {% func "smth" %} text">
Я использую этот код для получения значения заголовка:
/<[a-z]+[^>]*\s+(title|alt)\s*=\s*("[^"]*")/
но когда заголовок имеет {% func "smth" %}
, я получаю следующую строку:
"some {% func "
как получить полную строку?
Обновление: DOM не является решением, поскольку он будет интерпретировать приведенную выше ссылку как
<a href="#" title="some {% func " smth text></a>