Question

Я не могу найти, почему мои 2 переменные возвращают "None", пока они определены в циклах.

Even Печать ".span.text.find (" France "))" didn ' т работа. Я думаю, что мои две петли не выполнены. Я не знаю почему.

Я тоже сомневаюсь, что проблема в супе. Действительно, иногда это работает. иногда не там, где я не трогаю код.

#IMPORT DES LIBRAIRIRES
import bs4
import requests
import re
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
import urllib.request
from bs4 import BeautifulSoup
from datetime import date


#VARIABLES                              
date_jour = date.today()
URL ="https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6"

# Chrome session USING SELENIUM
#driver = webdriver.Chrome("C:/Users/33769/Desktop/chromedriver.exe")
#driver.get(URL)
#driver.implicitly_wait(100)
#soup=bs4.BeautifulSoup(driver.page_source,"html.parser")

#USING REQUESTS
req = requests.get('https://en.wikipedia.org/wiki/Python_(programming_language)')
soup=bs4.BeautifulSoup(req.text,"html.parser")


nb_infected = None
nb_deaths = None

#Infected Cases France
for span in soup.find_all('div',{'class':'flex-fluid list-item-content overflow-hidden'})[:12]:
    if span.text.find("France")!= -1:
        nb_infected = span.text.replace('\n\n','')
        nb_infected = nb_infected.replace('\xa0','')
        nb_infected = nb_infected.replace('France','')
        print("OKKKKKK")
    else:
        print("NOT OK")
    print(span.text.find('France')) # NOT EXECUTED... WHY ???


#Deaths France
for span in soup.find_all('div',{'class':'flex-fluid list-item-content overflow-hidden'})[420:480]:
    if span.text.find("France")!= -1:
        nb_deaths = span.text.replace('\n\n','')
        nb_deaths = nb_deaths.replace('\xa0','')
        nb_deaths = nb_deaths.replace('deaths\nFrance','')

print("To conclude, in France, there are " + str(nb_infected) + " infected individuals and " + str(nb_deaths) + " deaths" )
#ONLY THIS LAST FINE WORKS....

QHarr · Answer 1 · 31 марта 2020

Существует другая конечная точка, которая постоянно предоставляет обновленные данные. Вы можете вместо этого нажать xhr и проанализировать возвращенный json. Кажется, вы можете использовать данные, если для образовательных целей, которые я считаю, это квалифицируется как.

import requests

headers = {
   'Referer': 'https://www.arcgis.com/apps/opsdashboard/index.html',
    'User-Agent': 'Mozilla/5.0',
}

r = requests.get('https://services9.arcgis.com/N9p5hsImWXAccRNI/arcgis/rest/services/Nc2JKvYFoAEOFCG5JSI6/FeatureServer/2/query?f=json&where=Recovered%3C%3E0&returnGeometry=false&spatialRel=esriSpatialRelIntersects&outFields=*&orderByFields=Recovered%20desc&resultOffset=0&resultRecordCount=250&cacheHint=true', headers=headers, verify=False)
data = r.json()['features']
france = [i['attributes'] for i in data if i['attributes']['Country_Region'] == 'France']
if france:
    print(france)
    print("To conclude, in France, there are " + f'{france[0]["Confirmed"]:,}' + " infected individuals and " + f'{france[0]["Deaths"]:,}' + " deaths" )

Amaumox · Answer 2 · 31 марта 2020

Я получил свой ответ! Я использовал селен для создания страницы из драйвера и использовал time.sleep (5), чтобы страница отображалась правильно! Вот код:

#IMPORT DES LIBRAIRIRES
import bs4
import requests
import re
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
import urllib.request
import time
from bs4 import BeautifulSoup
from datetime import date


#VARIABLES                              
date_jour = date.today()
URL ="https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6"


# Chrome session
driver = webdriver.Chrome("C:/Users/33769/Desktop/chromedriver.exe")
driver.get(URL)
driver.implicitly_wait(100)
time.sleep(5)

soup=bs4.BeautifulSoup(driver.page_source,"html.parser")

nb_infected = None
nb_deaths = None

#Infected Cases France
for span in soup.find_all('div',{'class':'flex-fluid list-item-content overflow-hidden'})[:12]:
    if span.text.find("France")!= -1:
        nb_infected = span.text.replace('\n\n','')
        nb_infected = nb_infected.replace('\xa0','')
        nb_infected = nb_infected.replace('France','')

#Deaths France
for span in soup.find_all('div',{'class':'flex-fluid list-item-content overflow-hidden'})[420:480]:
    if span.text.find("France")!= -1:
        nb_deaths = span.text.replace('\n\n','')
        nb_deaths = nb_deaths.replace('\xa0','')
        nb_deaths = nb_deaths.replace('deaths\nFrance','')

print("To conclude, in France, there are " + str(nb_infected) + " infected individuals and " + str(nb_deaths) + " deaths" )

Почему строки, проанализированные через BeatifulSoup, возвращаются как None?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему строки, проанализированные через BeatifulSoup, возвращаются как None?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов