Я использую urllib2, чтобы открыть URL. Теперь мне нужен HTML-файл в виде строки. Как мне это сделать?
Самый простой способ будет:
f = urllib2.urlopen("http://example.com/foo/bar") s = f.read() # s now holds the contents of the site
Более подробная информация содержится в urllib2 документах .
urlopen() возвращает объект, подобный файлу, поэтому методы файлового объекта Python работают.
urlopen()
В python3 его следует изменить на urllib.request.openurl('http://www.example.com/').read().decode('utf-8').
urllib.request.openurl('http://www.example.com/').read().decode('utf-8')
я думаю, что в python3 метод urllib.request.openurl (метод * http://www.example.com/').read() возвращается в двоичном режиме
>>> import urllib2 >>> s = urllib2.urlopen('http://www.google.com').read() >>> s <big long string here>