webscrypt только одна часть класса? - PullRequest
0 голосов
/ 27 февраля 2020

Я новичок в webscrypt. Я просто создаю webscrypt, но у меня есть проблема с той частью, которую я хочу получить!

Когда я запускаю свой скрипт, он дает мне Voir l’information détaillée de Queco Electric Ltd, но я хочу только получить Queco Electric Ltd Смотрите код ниже, чтобы понять! Спасибо вам за помощь, ребята!

webscript.py

from bs4 import BeautifulSoup
import requests


def test():
    url = 'https://www.pagesjaunes.ca/search/si/1/electricien/Montreal+QC'
    r = requests.get(url)

    soup = BeautifulSoup(r.text)

    name = soup.find_all("a",{"class":"listing__name--link listing__link jsListingName"})
    for i in name:
        names = i.get("title")
        print(names)
test()

Результат печати:

Voir l’information détaillée de Les Entreprises Electriques G P E Inc
Voir l’information détaillée de Michel Guimont Entrepreneur Electricien Ltée
Voir l’information détaillée de PGR Électrique Inc
Voir l’information détaillée de Queco Electric Ltd
Voir l’information détaillée de Construction Hydro Métropolitain

DOC enter image description here

Ответы [ 2 ]

0 голосов
/ 27 февраля 2020

Измените свой суп с этим и также для l oop ...

from bs4 import BeautifulSoup
import requests


def test():
    url = 'https://www.pagesjaunes.ca/search/si/1/electricien/Montreal+QC'
    r = requests.get(url)
    # change this
    soup = BeautifulSoup(r.content, 'html.parser')

    name=soup.find_all("a", {"class":"listing__name--link listing__link jsListingName"})
    for i in name:
        # change this
        name = i.text
        print(name)
test()
0 голосов
/ 27 февраля 2020

Попробуйте этот код

import requests


def test():
    url = 'https://www.pagesjaunes.ca/search/si/1/electricien/Montreal+QC'
    r = requests.get(url)

    soup = BeautifulSoup(r.text)

name=soup.find_all("a",{"class":"listing__name--link listing__link jsListingName"})
    for i in name:
        # phone=i.a.get("data-phone")
        name=i.text
        print(name) ```
...