Как отслеживать релевантные просмотры с помощью php - PullRequest
2 голосов
/ 24 ноября 2011

Я бы хотел отслеживать все просмотры страницы, используя php и mysql.Я буду отслеживать количество раз, когда человек просматривал страницу и IP-адрес, а также текущую дату.Однако есть ли способ убедиться, что вы отслеживаете реальных пользователей, а не ботов / пауков?

Ответы [ 3 ]

1 голос
/ 24 ноября 2011

Я вижу два варианта:

  1. Создайте «скрытую» ссылку на своей домашней странице для медового банка .Любой, кто попадает на страницу «медового банка», должен считаться ботом и не включаться в вашу статистику

2: Это не надежный способ, но вы можете сравнить User Agent браузера.Строка в белый список известных веб-браузеров.Эта строка может быть подделана, поэтому она не самая надежная.

Лично я бы выбрал первый вариант.

Для банка с медом:

на вашей домашней странице я бы добавил что-то вроде этого:

<a href="totallyNotATrap.php" style="Display:none">ReallyNotATrap</a>

и на самой странице медового банка что-то вроде этого:

$BotIp=$_SERVER['REMOTE_ADDR'];
//DB connection 
Insert into BlackList($BotIp,$Date,$otherDataYouCareAboutLogging);
//close DB Connection

Тогда для вашего кода статистики просто сравните Ip каждого пользователя с таблицей BlackList.Если пользователя нет, запишите статистику.

РЕДАКТИРОВАТЬ

Как указано ниже, Googlebot может быть обманут этим.Если это то, что имеет для вас значение (если вы просто фильтруете свою собственную статистику, а не фильтруете контент, это не имеет значения), включите страницу honeypot в свой файл Robots.txt.Google прочтет текстовый файл и избежит ловушки.Другие неприятные боты попадут в него.Так как Google избежит нашей ловушки, я бы также использовал вариант 2 и отфильтровал строку пользовательского агента Google из статистики.

0 голосов
/ 24 ноября 2011

Вы можете попробовать мой сценарий отслеживания, он довольно прост в реализации, и боты и пауки выступят в роли бункерного браузера, поэтому их легко отсеять. Я использую это на всех сайтах моей компании для аналитики. Однако есть одно предостережение: если вы используете это для отслеживания ключевых слов, вы очень скоро будете разочарованы, потому что Google начинает изменять структуру своих строк запросов для зарегистрированных пользователей.

https://github.com/k4t434sis/tracking.php

0 голосов
/ 24 ноября 2011

Количество реальных пользователей должно быть в основном таким же числом, что и количество реальных пользователей - ботов.Если вы хотите, вы можете проверить агента пользователя, который скажет вам, кто просматривает сайт.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...