У меня есть работающий RegEx, который я использую, чтобы перечислить все ссылки, найденные в данном HTML-контенте
<a\s[^>]*href=(\"??)(http[^\" >]*?)\\1[^>]*>(.*)<\/a>
Это на самом деле работает довольно хорошо, проблема сейчас в том, что я хочу исключить из результатов все внутренние ссылки (на первый взгляд этого будет достаточно, чтобы получить тольковключая «http», но, к сожалению, множество внутренних «абсолютных» ссылок.test.com / test.com
Я посмотрел ссылку на Negative Lookahead, но я не уверен, как она должна быть реализована в существующем RegEx ..
Спасибо Cheers