Следующий код печатает слишком много пустого пространства для большей части вывода.
import bs4 import requests res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1') soup = bs4.BeautifulSoup(res.text, 'lxml') print(soup)
Вот часть вывода, где форматирование становится проблемой:
Sportsbooks & The Industry Service Plays / " > N e w b i e F o r u m / a > / l i >
Prettify ничего не меняет. Есть идеи, почему это происходит?
Попробуйте это:
Изменить на суп = bs4.BeautifulSoup (res.text, 'html.parser') вместо 'lxml'
import bs4 import requests res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1') soup = bs4.BeautifulSoup(res.text, 'html.parser') print(soup)
Если вы проверите исходный код веб-сайта, вы увидите, что вокруг него есть пробелы (щелкните правой кнопкой мыши веб-страницу и нажмите « Показать исходный код страницы »)
Я запускаю ваш код, и он печатается без перевода строки и пробелов.
Вы можете сделать что-то вроде
import bs4 import requests res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1') soup = bs4.BeautifulSoup(res.text, 'lxml') print(soup.prettify())