Я хочу напечатать в формате Сертификаты [тег h3] - затем таблица под ним, затем другие документы [h3] - затем таблица под ним.Но с bs4 я могу найти эти текстовые значения отдельно, а не вместе в формате.Я новичок, когда дело доходит до BS4.Ссылка на страницу - https://www.zaubacorp.com/documents/KAKDA/U01122MP1985PTC002857 Кроме того, мой код, чтобы найти их отдельно:
import requests
import urllib.request
from bs4 import BeautifulSoup
def make_soup(url):
thepage = urllib.request.urlopen(url)
soupdata = BeautifulSoup(thepage,"html.parser")
return soupdata
soup=make_soup
("https://www.zaubacorp.com/documents/KAKDA/U01122MP1985PTC002857)
soup.prettify()
divs =soup.findAll("td", {"class" :"tab-tc-2"})
divs
soup.findAll("td")
soup.findAll('h3',{'class':'pull-left'})
date = [i.get_text() for i in soup.findAll('td',{"class" :"tab-tc-1"})]
date
header = [i.get_text() for i in soup.findAll('h3',{'class':'pull-left'})]
header
soup.findAll('h3',{'class':'pull-left'})
import pandas as pd
data=pd.DataFrame({"Date":date,"Certificates":Certi})
data
data