Я относительно новичок в программировании и совершенно новый в переполнении стека. Я думал, что хороший способ учиться будет с проектом на основе Python & Excel, но я застрял. Мой план состоял в том, чтобы очистить веб-сайт от адресов с помощью красивого супа, найти оценки стоимости этих адресов и заполнить их в табличной форме в Excel. Я не могу понять, как получить адреса (HTML-код на сайте, который я пытаюсь почистить, кажется довольно грязным), но мне удалось получить ссылки адресов Google с сайта. Извините, если это очень простой вопрос, любой совет может помочь:
from bs4 import BeautifulSoup
from urllib.request import Request,
urlopen
import re
import pandas as pd
req = Request("http://www.tjsc.com/Sales/TodaySales")
html_page = urlopen(req)
soup = BeautifulSoup(html_page, "lxml")
count = 0
links = []
for link in soup.findAll('a'):
links.append(link.get('href'))
count = count +1
print(links)
print("count is", count)
po = links
pd.DataFrame (po) .to_excel ('todaysale.xlsx', header = False, index = False)