Отслеживание старых загруженных файлов на веб-сервере. Как узнать, что больше не используется? - PullRequest
2 голосов
/ 10 мая 2010

Пользователи могут загружать на сервер файлы, которые сохраняются эффективно навсегда.

Я хочу знать, есть ли у кого-нибудь идея для отслеживания бесхозных файлов. Некоторые из моих идей связаны с регистрацией каждой загрузки, но тогда на файлы обычно ссылаются в формате html, который нелегко отслеживать.

Файлы могут храниться неиспользованными, но на них все равно можно ссылаться. Я мог бы сделать полный текстовый поиск по ним, но это довольно грубая сила.

Должен ли я просто сдаться и позволить им состариться?

1 Ответ

3 голосов
/ 10 мая 2010

Я не знаю вашей ситуации, но то, что я делал в прошлом, это переместил все старые файлы (изображения) в одну папку из папки с изображениями и использовал Xenu для проверки ссылок на всех моих HTML-страницах. В конце проверки ссылки Xenu вернул список 404. Затем я написал сценарий, используя список 404, чтобы переместить файлы из резервной копии обратно в папку изображений.

Это сработало замечательно ... Тем не менее, несколько недель следил за файлами журналов, хотя на всякий случай я что-то пропустил.

Xenu, BTW, это бесплатное приложение, которое поможет вам найти неработающие ссылки, предоставив ему стартовую страницу. Затем он находит ссылки на этой странице, чтобы сканировать весь ваш сайт. Потребуются дополнительные стартовые страницы, если во время сканирования не найдены страницы, содержащие ссылки на эти файлы.

...