Извлечь все изображения из HTML, ширина или высота которых превышает указанное значение - Regex - PullRequest
1 голос
/ 14 июня 2011

Я пытаюсь создать небольшую функцию обмена ссылками с классическим ASP, таким как LinkedIn или Facebook.

Мне нужно получить HTML-код удаленного URL и извлечь все изображения, ширина которых, например, превышает 50 пикселей.

Я могу сканировать и брать HTML, а также могу найти изображения с этим регулярным выражением:

<img([^<>+]*)>

Это соответствует; <img src="/images/icon.jpg" width="60" height="90" style="display:none"/>

Тогда я могу извлечь путь, но иногда он совпадает с <img src="/track.php" style="display:none" width="1" height="1"/>, который не является реальным изображением.

В любом случае, я чувствую, что ты будешь злиться из-за классического ASP, но моей компании ...

Я знаю, что есть много тем по этой проблеме, и в основном они рекомендуют не использовать регулярные выражения, но я не смог найти пути к этому с классическим asp. Есть ли какой-то компонент или что-то в этом роде?

Привет

1 Ответ

0 голосов
/ 14 июня 2011

Это приблизит вас:

<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>

Он принимает теги изображений шириной 50 или более.

Редактировать: теги с неопределенной шириной:

<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>|<img ((?!width=)[^>])*>
...