Как получить HTML из XML? - PullRequest
       35

Как получить HTML из XML?

0 голосов
/ 07 октября 2019

Я пытаюсь получить HTML-код из XML-файла, и все, что я получаю, это отдельные элементы.

Пример XML:

  <?xml version="1.0" encoding="ISO-8859-1"?>
  <websites>
    <website name="1">
      <html xmlns="http://www.w3.org/1999/xhtml">
        <head>
          <title/>
        </head><body>Sample Content.....</body>
      </html>
    </website>
  </websites>

Мне нужна строкасодержащий только HTML, как это

<html xmlns="http://www.w3.org/1999/xhtml">
  <head>
    <title/>
   </head><body>Sample Content.....</body>
</html>

1 Ответ

0 голосов
/ 07 октября 2019

Вы можете использовать beautifulsoup :

from bs4 import BeautifulSoup

example = """
<?xml version="1.0" encoding="ISO-8859-1"?>
<websites>
  <website name="1">
    <html xmlns="http://www.w3.org/1999/xhtml">
      <head>
        <title/>
      </head><body>Sample Content.....</body>
    </html>
  </website>
</websites>
"""

soup = BeautifulSoup(example)
html = soup.find('html')
print(html)

Выход:

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title></title>
</head><body>Sample Content.....</body>
</html>
...