Я использую Ruby для поиска / хранения всех ссылок на веб-странице, которая указывает на другой ресурс (например, на другую HTML-страницу).
Очевидно, что ссылки, подобные приведенным ниже, являются реальными ссылками:
<a href="/resource">Dummy 3</a>
Я сталкиваюсь с ссылками, подобными приведенным ниже, которые на самом деле не являются ссылками на ресурсы:
<a href="#">Dummy</a>
<a href="javascript:void()">Dummy 2</a> //a javascript link could redirect me to another resource, but I am not interested in these
Я пытаюсь выработать правило об исключении ссылок, таких как 2 выше.
Есть ли другие ссылки, которые я должен исключить, кроме "#" и всего, что начинается с "javascript:"?