Я пытаюсь очистить этот веб-сайт, чтобы подготовить базу данных для лагерей доноров крови с использованием python.
Во-первых, при попытке получить html-исходный код веб-сайта из запросов или urllib существует SSl: certificate_verify_error, который я обошел, установив параметр verify в False для request.get () или создав непроверенный контекст для urllib (быстрое исправление), это избавляет меня от ошибки, но когда я вижу извлеченный исходный HTML-код, то содержимое таблицы, в которой я нуждаюсь, пусто, в исходном коде веб-сайта они включены в теги tbody, но моя команда request.get () получаетМне только эти теги, а не содержание между ними.Я очень новичок в соскобе, небольшое руководство будет оценено.ty
from urllib.request import urlopen as uReq
import ssl
from bs4 import BeautifulSoup as soup
my_url = 'https://www.eraktkosh.in/BLDAHIMS/bloodbank/campSchedule.cnt'
sp_context = ssl._create_unverified_context()
uClient = uReq(my_url,context=sp_context)
page_html = uClient.read()
uClient.close()
page_soup=soup(page_html,"html.parser")
table = page_soup.find('tbody')
print (table) #this outputs "<tbody></tbody>"
trow = table.find('tr')
print (trow) #this outputs "None"
Первая команда печати дает
<tbody>
</tbody>
и вторые выходные данные
None