Как сохранить действительность кода шаблона Django в BeautifulSoup - PullRequest
0 голосов
/ 02 мая 2018

Я пытаюсь работать с некоторыми шаблонами Django, используя Beautiful Soup. В некоторых случаях, когда я помещаю html, содержащий код Django, через экземпляр BeautifulSoup, суп выводит недопустимый код Django:

from bs4 import BeautifulSoup

django_string = '<a href="{% url "some_url" %}">'
soup = BeautifulSoup(django_string, 'html.parser')
print(soup)
<a %}"="" href="{% url " some_url"="">
# expected <a href="{% url "some_url" %}">

Я также пытался использовать парсеры html5lib и lxml. Выход синтаксического анализатора lxml немного отличается от указанного выше, но все еще недействителен.

Есть ли способ использовать Beautiful Soup для вывода действительного кода шаблона Django, или я достиг пределов того, для чего он предназначен?

1 Ответ

0 голосов
/ 02 мая 2018

У вас есть два набора двойных кавычек, поэтому BeautifulSoup считает, что ваша строка должна быть разбита на несколько атрибутов. Попробуйте использовать одинарные кавычки внутри части Django:

django_string = '<a href="{% url \'some_url\' %}">'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...