Python для начинающих (без веб-разработок) здесь: html-страница показывает список друзей в сети человека (каждое имя имеет тег привязки с ссылкой на список друзей сети).Так как на странице есть таймер, я написал код py, чтобы очистить m-ю позицию (друга) n-го числа (страницы), пройдя через цикл: (m-> n-> m-> n ....).И это работает!
Код:
import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE
url = input('Enter URL: ')
position = int(input('Enter position: ')) #Name/link Traverse
count = int(input('Enter count: ')) #Page Traverse
print("Retrieving:", url)
for c in range(count): #returns range of indices
html = urllib.request.urlopen(url, context=ctx).read() #opening URL
soup = BeautifulSoup(html, 'html.parser')
a_tags=soup('a')
link=a_tags[position-1].get('href', None) #url = href(key) value pair
content=a_tags[position-1].contents #name=a_tag.contents
url=link
print("Retrieving:", url)
Вход:
Enter URL: http://py4e-data.dr-chuck.net/known_by_Kory.html
Enter position: 1
Enter count: 10
Выход:
Retrieving: http://py4e-data.dr-chuck.net/known_by_Kory.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Shaurya.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Raigen.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Dougal.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Aonghus.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Daryn.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Pauline.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Laia.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Iagan.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Leanna.html
Retrieving: http://py4e-data.dr-chuck.net/known_by_Malakhy.html
Вопросы:
Есть ли лучший способ подойти к этому?(библиотеки, обходные пути для задержки таймера) lol)
Моя цель - составить исчерпывающий «список» друзей всех уникальных Имен здесь;Я не хочу никаких кодов, просто предложения и подходы подойдут.