«Пользователи», отправляющие запросы GET на веб-сайт, когда ожидается POST - PullRequest
7 голосов
/ 20 апреля 2011

Я продолжаю видеть странное поведение в наших журналах, где URL-адреса, к которым обычно следует обращаться только через запрос POST, вызываются через GET. URL-адреса включают в себя те, которые когда-либо создавались только с помощью javascript, поэтому вы не ожидаете, что обычный паук встретит их. Если я ищу в наших журналах IP-адрес, с которого поступают эти запросы, создается впечатление, что этот пользователь отправлял нам только GET-запросы.

Это не похоже на типичное поведение бота - запросы распределяются, а не рассылают на наш сервер кучу запросов в короткие сроки. Все пользовательские агенты - это обычные браузеры. Однако - и это немного умозрительно - на самом деле это не похоже на то, что человек просматривает сайт, так как они, кажется, прыгают повсюду, а не переходят по одной ссылке на другую.

Кто-нибудь еще видит такое поведение на своем сайте? Любые предложения, что вызывает это?

Ответы [ 3 ]

9 голосов
/ 28 апреля 2011

Это может быть кто-то, кто ловит подвиги на вашем сайте.Они проанализируют ваши формы, а затем создадут свои собственные URL-адреса в поисках слабых сторон или нестандартных способов использования сервиса.Если обычно это один и тот же IP-адрес, вы, вероятно, можете предположить, что это так.

Одним из примеров может быть то, что вы являетесь поставщиком потокового мультимедиа, и кто-то пытается собрать воедино исходные URL-адреса для сценария загрузки видео.Хотя зачастую это просто спамеры, стремящиеся передать через ваши контактные формы.

Не берите слишком много от IP-адресов и пользовательских агентов.Первый может быть прокси (через сети, такие как Tor), а последний может быть изменен по желанию.То, что IP-адреса и пользовательские агенты меняются, не означает, что это не тот же пользователь, который генерирует запросы.

7 голосов
/ 22 апреля 2011

Я часто перебираю сайты для получения информации, и когда мне действительно лень, я отправлю все как GET вместо использования POST ... много раз, CGI, для которых требуется POST, приметGET.Я настроил свой сценарий на использование случайного USER-AGENT из списка: либо safari на ipad, firefox на XP, либо Internet Exploder на Vista.

Кто знает, может быть, я очищаю ваш сайтбаллы за ответ; -).

4 голосов
/ 20 апреля 2011

Просто дикое предположение:

  • Существует нечто, называемое «веб-ускоритель», плагин для браузера, который предварительно выбирает ссылки, поэтому, когда вы решили щелкнуть по нему, он уже был кэширован. Это не должно кэшировать вещи, которые выглядят как запросы, но, возможно, некоторые обнаружат, что ваши URL подходят для предварительной выборки. Поскольку он запускается в браузере, он по крайней мере будет видеть все URL-адреса, добавленные в документ javascript (посредством доступа document.write или DOM).

  • «Веб-ускоритель» также может быть реализован как часть веб-прокси. Это кажется менее вероятным, потому что это должно было бы интерпретировать javascript, но если URL-адреса появляются в javascript полностью, это может быть просто поиск любого текста для всего, что выглядит как URL, и может найти их.

Это объясняет, почему запросы распределяются (такая вещь будет запускать пару запросов каждый раз, когда реальный пользователь посещает сайт), почему строки пользовательского агента соответствуют реальному браузеру (если это плагин браузера, он использует своего пользователя строка агента) и почему они перепрыгивают повсеместно (они одновременно пытаются предварительно выбрать несколько ссылок, и, вероятно, эвристический выбор, какие из них должны быть, не работает с вашим сайтом).

...