Я думаю, что у вас нет чистых решений, если вы просматриваете страницу, где меняется содержание.
Я разработал несколько скребков Python, и я знаю, как это может расстраивать, когда сайт просто вносит незначительные изменения в свой макет.
Вы можете попробовать решение по механизму (не знаю, что такое php), и если вам повезет, вы можете выделить контент, который вам нужно извлечь (ссылки?).
Другой возможный подход заключается в кодировании некоторых ограничений и проверке их перед сохранением в БД.
Например, если вы очищаете URL-адреса, вам необходимо убедиться, что проанализированный скребок является формально действительным URL-адресом; то же самое для целочисленного идентификатора или всего, что вы хотите очистить, и которое может быть распознано как действительное.
Если вы просматриваете простой текст, проверить будет сложнее.