Вы определяете поисковые системы по пользовательскому агенту и IP-адресу . Более подробную информацию можно найти в Как определить пауков и веб-роботов поисковых систем . Также стоит отметить этот список . Однако вы не должны относиться к пользовательским агентам (или даже к удаленным хостам) как к определенным. Пользовательские агенты на самом деле не более, чем то, что говорит вам другой конец, и, конечно, вы можете сказать вам что угодно. Писать код под видом робота Google просто.
В PHP это означает просмотр $_SERVER['HTTP_USER_AGENT']
и $_SERVER['REMOTE_HOST']
.
Есть много поисковых систем, но, честно говоря, это всего лишь немногие, о которых вы действительно заботитесь вообще. Google и Yahoo вместе имеют почти весь рынок. Но, конечно, это зависит от того, чего вы пытаетесь достичь.
Примечание: очень осторожно относитесь к поисковым системам иначе, чем к обычным пользователям (например, к «злому дефису», как выразился Джоэл) когда дело доходит до контента . В особенно вопиющих случаях это может привести к удалению вашего сайта из этой поисковой системы. Даже если этого не произойдет, вы, вероятно, отпугнете некоторых пользователей, которые заходят на сайт, ожидая чего-то. Если вместо этого им будет предложено поле «Пожалуйста, зарегистрируйтесь, чтобы увидеть эту статью», хорошо, поблагодарите за ваш высокий показатель отказов.