У меня есть вопрос о теге extract. Это схема HTML.
<div class="content_body_ty1">
<div class="us_label_wrap">..</div>
<h2 class="us_label">
<dl class="tc_list">
<dt class = "merit">merit</dt>
<dd class = "df1">
<span> blah~~~~~~~~blah~~~~</span>
</dd>
<dt class = "disadvantages">disadvantages</dt>
<dd class = "df1">
<span> blah~~~~~~~~blah~~~~</span>
</dd>
<dt class = "df_tit">wish</dt>
<dd class = "df1">
<span> blah~~~~~~~~blah~~~~</span>
</dd>
Я хочу извлечь содержимое тега, используя for-l oop. Затем поместите элемент в список. 1) "заслуга", бла ~~~~ 2) "недостатки", бла ~~~~ 3) "df_tit", бла ~~~~
Здесь мой код
maximum = 3
merit = []
disadv = []
tit = []
for page_number in range(1, maximum+1):
URL = 'https://www.example.co.kr/companies/reviews/page={}'.format(page_number)
response = client.get(URL)
print(page_number)
whole_source = response.content.decode('utf-8')
soup = BeautifulSoup(whole_source, 'html.parser')
for entry in soup.find_all('dl', class_ = 'tc_list'):
if entry.find('dt', class_ = 'merit'):
merit.append(entry.find('dd', class_ = 'df1'))
elif entry.find('dt', class_ = 'disadvantage'):
disadv.append(entry.find('dd', class_ = 'df1'))
elif entry.find('dt', class_ = 'df_tit'):
tit.append(entry.find('dd', class_ = 'df1'))
Как мне извлечь содержимое тега. Пожалуйста, проверьте эту проблему. Спасибо!