Question

У меня есть список на python3, который выглядит примерно так:

Из этого файла я хочу создать новый список, который принимает только URL-адресаиз другого списка, разделенного запятыми и заключенного в двойные кавычки ("), и, если возможно, также отфильтруйте все URL, содержащие" i.redd.it "

Вот код, если он помогает:

from bs4 import BeautifulSoup
import requests
import re
import urllib.request
import urllib3

http = urllib3.PoolManager()

url = "https://reddit.com/r/me_irl"
response = http.request('GET', url)
soup = BeautifulSoup(response.data, "lxml")
tags = soup.find_all('a')
hrefs = []
for t in tags:
    hrefs.append(t)

print(hrefs)

chitown88 · Answer 1 · 18 февраля 2019

Вы могли бы сделать понимание списка.Я также включил бы эту строку:

tags = soup.find_all('a', href=True)

, так как вам нужны только теги с URL

from bs4 import BeautifulSoup
import requests
import re
import urllib.request
import urllib3

http = urllib3.PoolManager()

url = "https://reddit.com/r/me_irl"
response = http.request('GET', url)
soup = BeautifulSoup(response.data, "lxml")
tags = soup.find_all('a', href=True)

hrefs = [ ele['href'] for ele in tags if 'i.redd.it' in ele['href']]

Однако, это вернет пустой список, так как там нет ссылоккоторые содержат 'i.redd.it'

Но если вам нужны URL, вы можете избавиться от оператора if или изменить его, если хотите:

 hrefs = [ ele['href'] for ele in tags ]

Как получить ссылки только из списка в Python3?[Начальный]

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить ссылки только из списка в Python3?[Начальный]

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов