Извлечь CSS из HTML-страницы - PullRequest
       1

Извлечь CSS из HTML-страницы

0 голосов
/ 02 сентября 2018

Мне нужно извлечь коды CSS из нескольких файлов HTML, но я не могу понять, как решить следующие две проблемы:

  1. Файл HTML может содержать более одного блока, содержащего код CSS.
  2. В HTML CSS помещается внутри тегов. Но и другой код. Мне нужен только код из <style type="text/css">.

Я посмотрел в Beautifulsoup, но пока не смог выяснить, возможно ли это с помощью этой библиотеки или мне нужно что-то написать самому.

Надеюсь, кто-нибудь здесь сможет мне помочь.

1 Ответ

0 голосов
/ 03 сентября 2018
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_code,'html.parser')
soup.find('style',{"type" : "text/css"})

Я пробовал этот код в HTML-коде ниже

<html>
<head>
<style type="text/css">
body {background-color: powderblue;}
h1   {color: blue;}
p    {color: red;}
</style>
</head>
<body>
<h1>This is a heading</h1>
<p>This is a paragraph1.</p>
<h4>This is a paragraph2.</h4>
<style>
h4   {color: red;}
</style>

И это был вывод, который я получил -

Выход
<style type="text/css">  
body {background-color: powderblue;}  
h1   {color: blue;}  
p    {color: red;}  
</style>

Вы видите, что у меня есть только тег стиля, который имеет type="text/css"

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...