У меня есть список примерно 4300 URL, все очень похоже.Вполне вероятно, что некоторые из них были удалены, и я хочу определить, какие из них больше не действительны.Я не заинтересован в контенте (на данный момент), только если он используется в реальном мире, если он в настоящее время возвращает действительный контент (http 200) или не существует (http 404).По сути, я ищу службу проверки связи URL.Это одноразовое упражнение.
Если не существует каких-либо инструментов, специально предназначенных для этой цели, я очень хорошо разбираюсь в Java и могу написать собственное решение.Тем не менее, я не хочу изобретать велосипед, и я не уверен, как лучше это сделать, чтобы он не выглядел как атака отказа в обслуживании.Будет ли приемлемо попадать по каждому URL по очереди, один за другим (чтобы не было одновременных запросов)?Я осознаю, что не буду чрезмерно напрягать целевой сервер.
Большое спасибо за любые идеи или предложения.