Очистить Specifi c Div в Python с BeautifulSoup - PullRequest
0 голосов
/ 09 июля 2020

В настоящее время я пытаюсь очистить текстовые данные с веб-страницы (https://www1.president.go.kr/articles/8863). Часть, которую я хочу, находится в [[[div class="text left cb text_wrap motion fadeIn visible" data-animation="fadeIn"]]]. Я пробовал soup.find('div', {'class' :'text left cb text_wrap motion fadeIn visible'}), но ничего не получаю.

response = requests.get('https://www1.president.go.kr/articles/8863')
if response.status_code == 404:
    print('404: A page could not load')
    exit(1)

soup = BeautifulSoup(response.content, 'html.parser')

data = [] #class="text left cb text_wrap motion fadeIn visible"
html = soup.find('div', {'class' :'text left cb text_wrap motion fadeIn visible'})


# Not returning correctly.
if html is None:
    print('it is not getting data')
    exit(2)

Что мне набрать, чтобы получить эту деталь?

1 Ответ

0 голосов
/ 09 июля 2020

вам нужно изменить это:

html = soup.find('div', {'class' :'text left cb text_wrap motion fadeIn visible'})

на это:

html = soup.find('div', {'class' :'text left cb text_wrap motion'})

, потому что если вы проверите источник страницы, этот div будет выглядеть так:

<div class="text left cb text_wrap motion" data-animation="fadeIn">
...