Я довольно плохо знаком с Python и программированием в целом. Я сделал несколько уроков, и примерно через две трети я изучил довольно хорошую книгу. При этом я пытаюсь освоиться с Python и программированием, просто пробуя что-то в std lib.
при том, что я недавно столкнулся со странной причудой, которая, я уверен, является результатом моего собственного неправильного или не "питонического" использования модуля urllib (с Python 3.2.2)
import urllib.request
HTML_source = urllib.request.urlopen(www.somelink.com).read()
print(HTML_source)
когда этот бит запускается через активный интерпретатор, он возвращает HTML-источник somelink, однако он ставит перед ним префикс b '
например
b'<HTML>\r\n<HEAD> (etc). . . .
если я разделю строку на список по пробелам, то к каждому элементу добавляется префикс b '
Я на самом деле не пытаюсь выполнить что-то конкретное, просто пытаюсь ознакомиться со стандартной библиотекой. Я хотел бы знать, почему этот b 'имеет префикс
также бонус - есть ли лучший способ получить исходный код HTML БЕЗ использования стороннего модуля. Я знаю весь этот джаз о том, что не изобретать велосипед, а что нет, но я пытаюсь научиться, «создавая свои собственные инструменты»
Заранее спасибо!