У меня есть это регулярное выражение
(?:\<a[^*]href="(http://[^"]+?|[^"]+?\.pdf)"+?[^>]*?)>
Смысл этого регулярного выражения в том, чтобы захватить каждый закрывающий тег ('>') якоря, у которого есть ссылка, начинающаяся с "http://" или заканчивающаяся" .pdf ".
Регулярное выражение работает, однако оно захватывает первую часть якоря, которое мне абсолютно НЕ нужно захватывать.
В следующих примерах все совпадают, кроме секунды (что нормально), но должна быть зафиксирована только последняя скобка, а это не так.
<a href="http://blabla">omg</a>
<a href="blabla">omg</a>
<a href="http://blabla.pdf">omg</a>
<a href="/blabla.pdf">omg</a>
Например: если мы возьмем первое совпадение:
<a href="http://blabla">
Я хочу взять только последнюю скобку (ту, которую я окружил скобками):
<a href="http://blabla"(>)
Так почему не захватившая группа захватывает? А как мне взять только последний кронштейн якоря
Даже если я упростил свое регулярное выражение до следующего, оно все равно не работает
(?:\<a[^*]href="http://[^"]+"+[^>]*)(>)
Спасибо,