Возможно, вы захотите добавить некоторую информацию о вашем оборудовании к вашему вопросу, это очень важно для того, кто посоветует вам, как легко будет масштабироваться ваша реализация.
Если вы в конечном итоге проанализируете миллионы ссылок, одна большая работа cron станет проблематичной. Я предполагаю, что вы делаете следующее (если нет, вам, вероятно, следует):
- Понимание того, когда пользователи подписываются на один и тот же фид, чтобы не получать его дважды.
- При получении нового фида проверьте наличие карты сайта, показывающей, как часто фид может меняться, повторно посетите это значение в разумный интервал
- Проверка загрузки системы и использования памяти, чтобы узнать, когда нужно «выключиться» и ненадолго заснуть.
Это уменьшает количество пота, которое производит почасовой крон.
Если вы собираете миллионы фидов, вам, вероятно, захочется распространить эту работу, о чем вы, возможно, захотите помнить, пока еще разрабатываете свою базу данных.
Опять же, пожалуйста, обновите ваш вопрос, указав подробную информацию об используемом оборудовании и о том, насколько масштабным должно быть ваше решение. Ничто не масштабируется «бесконечно», поэтому, пожалуйста, будьте реалистами:)