Мне нужно получить длинный список действительных URL-адресов для тестирования моего DNS-сервера.Я обнаружил, что на веб-странице есть множество ссылок, которые, вероятно, дадут достаточно хороших ссылок (http://www.cse.psu.edu/~groenvel/urls.html),), и я подумал, что самый простой способ сделать это - загрузить файл HTML и просто выполнить поиск URL-адресов.Однако я не могу заставить его перечислять мои результаты только по ссылке.
Я знаю, что есть много способов сделать это. Я не привередлив, как это делается.
Учитывая приведенный выше URL, я хочу получить список всех URL-адресов (по одному в строке), например:
http://www.cse.psu.edu/~groenvel/
http://www.acard.com/
http://www.acer.com/
...