Когда пользователь заходит на сайт (любой пользователь), запускается задание псевдокрона. По сути, каждая страница PHP подключена к среде, подобной cron, которая выполняет код при вызове.
Я говорю «псевдо», потому что вы не можете отличить его от настоящего. Единственный способ, которым вы можете сказать, - это просмотреть веб-страницу, чтобы проверить наличие нового контента, запустив задание (что происходит при запросе страницы).
Что касается сканера, зачем вам его сканировать? Просто загрузите канал RSS (большинство тем поддерживают его). Он содержит все последние сообщения в хорошем формате.