Что использовать для проверки HTML-ссылок в большом проекте, в Linux? - PullRequest
5 голосов
/ 15 марта 2010

У меня есть каталог с> 1000 .html файлами, и я хотел бы проверить все из них на наличие плохих ссылок - желательно с помощью консоли. Какой инструмент вы можете порекомендовать для такой задачи?

Ответы [ 4 ]

4 голосов
/ 15 марта 2010

вы можете использовать wget, например

wget -r --spider  -o output.log http://somedomain.com

в нижней части файла output.log, он будет указывать, нашел ли wget неработающие ссылки вы можете разобрать, используя awk/grep

2 голосов
/ 15 марта 2010

Я бы использовал checklink (проект W3C)

0 голосов
/ 15 марта 2010

Попробуйте webgrep инструменты командной строки или, если вам удобен Perl, модуль HTML :: TagReader того же автора.

0 голосов
/ 15 марта 2010

Вы можете извлечь ссылки из HTML-файлов, используя текстовый браузер Lynx . Скрипты Bash вокруг этого не должны быть сложными.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...