Для разбора HTML мы используем парсер, например BeautifulSoup .
Конечно, вы можете проанализировать это с помощью регулярного выражения, но это то, что вы никогда не должны делать. То, что в некоторых случаях это работает, не означает, что это стандартный или правильный способ. Если вам интересно узнать почему, прочитайте этот превосходный ответ здесь на SO.
Начните с урока BeautifulSoup и посмотрите, как анализировать необходимую информацию. Это довольно легко сделать. Мы не собираемся делать это для вас, то есть для вас, чтобы читать и учиться!
Просто для того, чтобы предупредить вас, у вас есть the_page
, который содержит данные HTML.
>> from BeautifulSoup import BeautifulSoup
>> soup = BeautifulSoup(the_page)
Теперь следуйте инструкции и узнайте, как получить все в теге head
.