Невозможно найти необходимый контент из html <section>: Python BS4 - PullRequest
0 голосов
/ 23 октября 2018

Я отказался от этого сайта для прогнозов погоды.Его HTML довольно вложенный, и я не могу получить необходимое содержимое.Раздел, который я хочу просмотреть, упоминается ниже:

Section to be scraped

Чтобы получить требуемые теги для html этого раздела, я использую следующий подход:

import requests
from bs4 import BeautifulSoup
import uuid
import csv
import dateutil.parser as parser


class met():
    def __init__(self):
        global homePage
        global downloadDir
        global filname
        downloadDir = ""
        uFileName = str(uuid.uuid4())
        filname = downloadDir + uFileName + ".csv"
        homePage = requests.get("https://www.met.ie/")

    def pageHtml(self):

        soup = BeautifulSoup(homePage.content, 'html.parser')
        titleList = soup.findAll('title')
        for div in soup.find_all("div"):
            for section in div.find_all('section', class_ = "container hourly-forecast mb-5",id = "24HourForecast"):
                #print(section)
                for div1 in section.find_all("div"):
                    print(div1)


if __name__ == '__main__':
    objCall = met()
    objCall.pageHtml()

После запуска этого кода я могу получить теги, но все эти теги взяты из предыдущего контейнера.Кто-нибудь может помочь мне следовать правильному подходу здесь, спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...