Как определить рекламу на сайте - PullRequest
1 голос
/ 02 ноября 2011

Я хотел бы программно проанализировать содержание веб-сайта и найти возможные места, где может размещаться реклама (или сами объявления).На разных веб-сайтах может быть размещена реклама разных поставщиков в разных форматах, и я бы хотел, чтобы мое решение выбрало как можно больше из них.

Как бы вы программно решили эту проблему.Пока что я нашел только одно решение, но я не очень доволен этим (причина ниже).

Очевидное решение состоит в серьезном поиске по регулярному выражению в исходном коде в поисках рекламного движка.конкретный JS и / или HTML.Я верю, что это похоже на то, что AdBlock использует для удаления рекламы с веб-сайтов в браузере.Однако, поскольку существует очень много рекламных движков, это было бы неэффективно и не просто в обслуживании (даже если мы рассмотрим использование черных списков AdBlock для подачи в поисковую систему).

Я бы хотел найти более общее решениек этой проблеме, и я не обязательно ищу окончательное решение.Будут полезны разные взгляды на проблему.

1 Ответ

1 голос
/ 02 ноября 2011

Я не думаю, что поддерживать список поставщиков рекламы - это , что сложно, особенно если учесть, что есть только несколько крупных игроков, которые обслуживают до 90% + всей рекламы.

Если вы не ищете универсальное решение, я бы сказал, что приемлемым показателем попадания будет 90% +.

Делая это «эвристически», вы можете просто пометить любой Flash или аналогичный носитель.объекты, обслуживаемые с домена, отличного от того, на котором находится страница хостинга?

...