Как очистить текст от p или div, вывод выдаст пустой список или ничего - PullRequest
0 голосов
/ 01 января 2019

Я пытаюсь очистить текст из выделенного и полного комментария раздела следующей ссылки cricbuzz page .Текст просто не появляется после нескольких дней попыток.Извините, но я новичок, и я не очень разбираюсь в вебскриптинге.

Я пробовал несколько других разделов, и мне удалось отсканировать текст и таблицы из них, но этот раздел имеет вкладки или кликабельныетекстовые данные, которые я не знаю, как почистить для этой конкретной страницы. Ниже приведен мой код для раздела основных моментов:

код:

from urllib.request import urlopen as req
from bs4 import BeautifulSoup as soup

my_url = "https://www.cricbuzz.com/cricket-match-highlights/20567/ausw-vs-nzw-10th-match-group-b-icc-womens-world-t20-2018"
uclient = req(my_url)
page_html = uclient.read()
uclient.close()
page_soup = soup(page_html, "html.parser")
highlights = page_soup.find_all("div",{"class":"cb-col cb-col-67 cb nws-lft-col"})

for highlight in highlights:
    text_highlight = highlights.text
    print(text_highlight)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...