HTTP-баннер с Python - PullRequest
       10

HTTP-баннер с Python

1 голос
/ 19 июня 2010

Я заинтересован в создании HTTP Banner Grabber, но когда я подключаюсь к серверу через порт 80 и отправляю что-то (например, «HEAD / HTTP / 1.1»), recv не возвращает мне ничего, как когда я это делаю скажем, в Netcat ..

Как мне поступить?

Спасибо!

Ответы [ 2 ]

2 голосов
/ 19 июня 2010

Попробуйте использовать модуль urllib2 .

>>> data = urllib2.urlopen('http://www.example.com').read()
>>> print data
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML>
<HEAD>
  <META http-equiv="Content-Type" content="text/html; charset=utf-8">
  <TITLE>Example Web Page</TITLE>
</HEAD> 
<body>  
<p>You have reached this web page by typing &quot;example.com&quot;,
&quot;example.net&quot;,
  or &quot;example.org&quot; into your web browser.</p>
<p>These domain names are reserved for use in documentation and are not available 
  for registration. See <a href="http://www.rfc-editor.org/rfc/rfc2606.txt">RFC 
  2606</a>, Section 3.</p>
</BODY>
</HTML>

>>>

Если обратиться к примерам, вы можете пропустить более тонкие баллы.Чтобы увидеть заголовок content-type:

>>> stream = urllib2.urlopen('http://www.example.com')
>>> stream.headers['content-type']
'text/html; charset=UTF-8'
>>> data = stream.read()
>>> print data[:100]
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML>
<HEAD>
  <META http-equiv=
>>>
2 голосов
/ 19 июня 2010

Вы отправляете "\ r \ n \ r \ n", чтобы указать конец запроса?Если нет, сервер все еще ожидает оставшуюся часть запроса.

...