Я строю скребок, в котором я хочу извлечь данные из некоторых тегов без какой-либо конвертации. Но Beautifulsoup изменил некоторые шестнадцатеричные значения на ASCII. Например, этот код преобразуется в ASCII
html = """\
<title>Billing address - PayPal</title>
<title>Billing address - PayPal</title>"""
Вот небольшой пример кода
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "lxml")
for element in soup.findAll(['title', 'form', 'a']):
print(str(element))
Но я хочу извлечь данные в той же форме. Я считаю, что BeautifulSoup 4 автоматически конвертирует сущности HTML, а это то, чего я не хочу Любая помощь будет очень признательна.
Кстати, я использую Python 3.5 и Beautifulsoup 4