После сканирования сайта объявлений, как проверить, не истек ли срок действия списков? - PullRequest
0 голосов
/ 04 июля 2011

Я заинтересован в создании веб-сканера для объявлений. Проблема с просканированными объявлениями заключается в том, что срок их действия истекает. Когда пользователь выполняет поиск на моем сайте, есть ли способ проверить «на лету», истек ли срок действия списков?

Как правило, если на моей странице отображается 20 записей, как проверить, не истек ли это? Есть ли способ проверить "на лету"? Скрыть эту запись, а не показывать ее пользователю? Возможно, скрипт .js, который checksDeletedRecords()?

http://carsforsale.com/used_cars_for_sale/2004_Honda_Civic_136820531

Ответы [ 2 ]

1 голос
/ 04 июля 2011

Вы можете написать что-то, что будет периодически проверять список (через задание cron) и видеть, истек ли срок его действия.

Если у просматриваемых страниц есть какой-то индикатор, который сообщит вам, когда истечет срок его действия.(«Срок действия списка истекает 8 июля 2011 г.»), ваш сканер может проанализировать его и затем сохранить в вашей БД.Тогда нужно отфильтровать просроченные с твоего конца.Большинство классифицированных сайтов имеют ограничение по времени в своих списках (либо указано в листинге, либо в качестве политики сайта) ... поэтому этот подход будет вашим лучшим выбором.

РЕДАКТИРОВАТЬ: И как всегда, когда вы сканируете, соблюдайтеrobots.txt

сайта
0 голосов
/ 04 июля 2011

Я делал что-то подобное раньше. Моим решением было добавить свойство LastFound в списки. Каждый раз, когда вы сканируете сайт и находите одно и то же объявление, обновляйте флаг LastFound.

Если вы затем сканируете сайт каждый день, вы можете предположить, что срок действия всех списков, не найденных в последний день, истек. Очевидно, что если вы сканируете сайт с более короткими интервалами, ваши данные могут быть более актуальными.

Это может не соответствовать вашему требованию "на лету", но решение может заключаться в том, чтобы проверять, существует ли оригинальная страница, каждый раз, когда вы хотите найти ее. Это было бы ужасно неэффективно, и я бы не стал его рекомендовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...