Question

Я пытаюсь найти определенные строки c на странице HTML, которую я удалил. Я использовал метод find_all () в bs4 и предоставил строковый аргумент, но он не работает.

веб-страница: https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pKVGlnQVAB?hl=en-IN&gl=IN&ceid=IN%3Aen

from bs4 import BeautifulSoup
import requests

def search(soup):                                                                                                                                        
    results = soup.find_all(string="Union",recursive=True)
    print(len(results))

web_url = "https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pKVGlnQVAB?hl=en-IN&gl=IN&ceid=IN%3Aen"

r = requests.get(web_url)
soup = BeautifulSoup(r.text,'html.parser')

search(soup)

Я получаю значение len (результатов) равным нулю. Моя функция поиска неверна?

pastaleg · Answer 1 · 21 марта 2020

При поиске со строковым аргументом вы заставляете findall () находить точные совпадения для каждого элемента Navigable. Вы можете сделать более простой поиск подходящих подстрок, используя regex logi c.

from bs4 import BeautifulSoup
import requests
import re

def search(soup):                                                                                                                                        
    results = soup.find_all(string=re.compile("Union"),recursive=True)
    print(len(results))

web_url = "https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pKVGlnQVAB?hl=en-IN&gl=IN&ceid=IN%3Aen"

r = requests.get(web_url)
soup = BeautifulSoup(r.text,'html.parser')

search(soup)

За это я получаю 7 матчей

findall в Beautifulsoup не работает для строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

findall в Beautifulsoup не работает для строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов