Мне нужно обработать содержимое HTML и заменить значение SRC IMG фактическими данными. Для этого я выбрал регулярные выражения.
В моей первой попытке мне нужно найти теги IMG. Для этого я использую следующее выражение:
<img.*src.*=\s*".*"
Затем в теге IMG я ищу SRC = "..." и замените его новым значением SRC. Я использую следующее выражение для получения SRC:
src\s*=\s*".*"\s*
Второе выражение, имеющее проблемы:
Для следующего текста это работает:
<img alt="3D""" hspace=
"3D0" src="3D"cid:TDCJXACLPNZD.hills.jpg"" align=
"3dbaseline" border="3d0" />
Но для следующего это не так:
<img alt="3D""" hspace="3D0" src=
"3D"cid:UHYNUEWHVTSH.lilies.jpg"" align="3dbaseline"
border="3d0" />
Что происходит, если выражение возвращает
src="3D"cid:TDCJXACLPNZD.hills.jpg"" align=
"3dbaseline"
Он не возвращает только часть src, как ожидалось.
Я использую библиотеку регулярных выражений C ++ Boost.
Пожалуйста, помогите мне разобраться в проблеме.
Спасибо,
Хильми.