Python красивый суп / Найти - PullRequest
0 голосов
/ 22 апреля 2020

Мой вопрос заключается в том, что когда я распечатываю список ссылок, он выводит красивый список в терминале, но я не знаю, почему ссылки (список) не содержат метод find? Кроме того, этот же код работал над идеей моих учителей

import requests
from bs4 import BeautifulSoup

param = {'s': 'zombie'}
r = requests.get('http://chilltime.pk/search', params=param

soup = BeautifulSoup(r.text, "html.parser")
results = soup.find('tbody')
links = soup.findAll('td')

for i in links:
    item_text = i.find('a').text
    item_href = i.find('a').attrs['href']

    if item_text and item_href:
        print(item_text)
        print(item_href)
ERROR:
**Traceback (most recent call last):
File "C:/Users/AFFAN ULHAQ/PycharmProjects/Beautiful/bsp.py", line 19, in <module>
item_text = i.find('a').text
AttributeError: 'NoneType' object has no attribute 'text'**

Ответы [ 2 ]

1 голос
/ 22 апреля 2020

Скорее всего, итеративные ссылки на переменную "i" не имеют атрибута "a", то есть внутри вашей ячейки html нет ссылки. Может быть, это вы можете проверить, действительно ли у вас есть ссылка

for i in links:
    item_text = i.find('a').text if i.find('a') else False
    item_href = i.find('a').attrs['href'] if i.find('a') else False
1 голос
/ 22 апреля 2020
import requests
from bs4 import BeautifulSoup

params = {
    's': 'zombie'
}

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:75.0) Gecko/20100101 Firefox/75.0'
}


def main(url):
    r = requests.get(url, params=params, headers=headers)
    soup = BeautifulSoup(r.content, 'html.parser')
    target = soup.findAll("a", href=True)
    for tar in target:
        print(tar.text, tar['href'])


main("http://chilltime.pk/search")
...