Я хотел бы почистить этот сайт: http://waqfeya.com/book.php?bid=1
, но когда я получаю, я получаю символы, подобные этим.
Вот так выглядит мой сценарий:
import requests
from bs4 import BeautifulSoup
BASE_URL = "http://waqfeya.com/book.php?bid=1"
source = requests.get(BASE_URL)
soup = BeautifulSoup(source.text, 'lxml')
print(soup)
Я пробовал эти вещи, но у меня не работает:
source.encoding = 'utf-8'
и это:
source.encoding = 'ISO-8859-1'
также это:
soup = BeautifulSoup(source.text, from_endocing='ISO-8859-1')
Но никто не работал на меня.
Любая помощь, пожалуйста,
Заранее спасибо.