Я новичок в Python, и я пытаюсь собрать данные с веб-сайта.Моя проблема сейчас застряла в последнем потоке, где я хочу взять данные и перебрать их в Pandas dataframe перед сохранением их в файле базы данных / CSV.
Я попытался добавить данные, используя цикл, но кажется,что мой цикл не работает.если вы видите, просматривал ли я «cols», мне удалось очистить данные, но они не попали в таблицу.
import requests, pandas, numpy, matplotlib.pyplot
from bs4 import BeautifulSoup
#### page info ###
page = requests.get("https://postcode.my/search/?keyword=&state=Kedah")
#### check page status (will come 200 if the page is ok)
page.status_code
### call Library
soup = BeautifulSoup(page.content, 'html.parser')
### Find rows
rows = soup.find_all(class_="col-lg-12 col-md-12 col-sm-12 col-xs-12")
## define column
LOCATION = []
AREA = []
STATE = []
POSTCODE = []
TABLE = []
counter= 0
for row in rows:
cols = row.find_all("td")
cols = [x.text.strip() for x in cols]
if cols!='':
TABLE.append(cols)
counter=counter+1
if counter == 4:
LOCATION.append(TABLES[0])
AREA.append(TABLE[1])
STATE.append(TABLE[2])
POSTCODE.append(TABLE[3])
counter = (0)
TABLE = []
PDTABLE = pandas.DataFrame({
"LOCATION" : LOCATION,
"AREA" : AREA,
"STATE" : STATE,
"POSTCODE" : POSTCODE
})
PDTABLE
Спасибо, С наилучшими пожеланиями, Рейли Шахрил