Ошибка формата вывода BeautifulSoup: слишком много пробелов - PullRequest
0 голосов
/ 08 ноября 2018

Следующий код печатает слишком много пустого пространства для большей части вывода.

import bs4
import requests


res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1')
soup = bs4.BeautifulSoup(res.text, 'lxml')
print(soup)

Вот часть вывода, где форматирование становится проблемой:

Sportsbooks & The Industry    Service Plays    /   "   >   N   e   w   b   i   e       F   o   r   u   m   /   a   >   /   l   i   >   

Prettify ничего не меняет. Есть идеи, почему это происходит?

Ответы [ 2 ]

0 голосов
/ 10 ноября 2018

Попробуйте это:

Изменить на суп = bs4.BeautifulSoup (res.text, 'html.parser') вместо 'lxml'

import bs4
import requests


res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1')
soup = bs4.BeautifulSoup(res.text, 'html.parser')
print(soup)
0 голосов
/ 08 ноября 2018

Если вы проверите исходный код веб-сайта, вы увидите, что вокруг него есть пробелы (щелкните правой кнопкой мыши веб-страницу и нажмите « Показать исходный код страницы »)

Я запускаю ваш код, и он печатается без перевода строки и пробелов.

Вы можете сделать что-то вроде

import bs4
import requests


res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1')
soup = bs4.BeautifulSoup(res.text, 'lxml')
print(soup.prettify())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...