Я отказался от этого сайта для прогнозов погоды.Его HTML довольно вложенный, и я не могу получить необходимое содержимое.Раздел, который я хочу просмотреть, упоминается ниже:
Чтобы получить требуемые теги для html этого раздела, я использую следующий подход:
import requests
from bs4 import BeautifulSoup
import uuid
import csv
import dateutil.parser as parser
class met():
def __init__(self):
global homePage
global downloadDir
global filname
downloadDir = ""
uFileName = str(uuid.uuid4())
filname = downloadDir + uFileName + ".csv"
homePage = requests.get("https://www.met.ie/")
def pageHtml(self):
soup = BeautifulSoup(homePage.content, 'html.parser')
titleList = soup.findAll('title')
for div in soup.find_all("div"):
for section in div.find_all('section', class_ = "container hourly-forecast mb-5",id = "24HourForecast"):
#print(section)
for div1 in section.find_all("div"):
print(div1)
if __name__ == '__main__':
objCall = met()
objCall.pageHtml()
После запуска этого кода я могу получить теги, но все эти теги взяты из предыдущего контейнера.Кто-нибудь может помочь мне следовать правильному подходу здесь, спасибо