Что делает этот Perl-код, используя LWP :: UserAgent? - PullRequest
2 голосов
/ 11 мая 2010

У меня есть этот код:

use strict;
use LWP::UserAgent;
use warnings;
my $ua = new LWP::UserAgent(agent => 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.5) Gecko/20060719 Firefox/1.5.0.5');
$ua->proxy([qw(http https)] => 'http://59.39.92.148:1080');
my $response = $ua->get("http://www.google.com");
print $response->code,' ', $response->message,"\n";

Является ли смысл кода "открыть www.google.com с помощью sock proxy"? Какое объяснение?

Ответы [ 3 ]

3 голосов
/ 11 мая 2010

Это экземпляр объекта LWP :: UserAgent .

  • В параметрах указывается браузер Mozilla Firefox

  • Адрес и порт для подключения к прокси 'http://59.39.92.148:1080'

  • , и ответ Google пропущен через прокси:

    my $ response = $ ua-> get ("http://www.google.com");`

Наконец:

print $response->code,' ', $response->message,"\n";`

позволяет ответить пользователю обратно

Я разработчик на C #, но мне это так кажется:)

2 голосов
/ 11 мая 2010

Код устанавливает объект LWP :: UserAgent для маскировки под браузер, используемый человеком для обхода механизма обнаружения пауков Google. При этом он нарушает Условия использования Google :

5.3. Вы соглашаетесь не получать (или пытаться получить доступ) к каким-либо Услугам каким-либо образом, кроме как через интерфейс, предоставляемый Google, если вам не было специально разрешено сделать это в отдельном соглашении с Google. Вы, в частности, соглашаетесь не осуществлять доступ (или пытаться получить доступ) к каким-либо Услугам с помощью каких-либо автоматизированных средств (включая использование сценариев или сканеров веб-страниц) и должны гарантировать, что вы будете соблюдать инструкции, изложенные в любом файле robots.txt, представленном на Сервисах. .

59.39.92.148, вероятно, является скомпрометированным (или плохо настроенным) открытым прокси в Китае. Установка $ua для его использования является попыткой скрыть источник нарушения TOS.

Кстати, вы должны знать, что сервер на 59.39.92.148 сможет регистрировать и отслеживать все ваши запросы и ответы, если вы решите пойти по этому маршруту.

Более важный вопрос: Что вы пытаетесь сделать?

1 голос
/ 11 мая 2010

Похоже: откройте "www.google.com" с помощью HTTP-прокси

...