Я пытаюсь собрать дату, время и место проведения мероприятия. Они вышли успешно, но тогда это не дружелюбный читатель. Как сделать так, чтобы дата, время и место отображались отдельно, например:
- event
Date:
Time:
Venue:
- event
Date:
Time:
Venue:
Я думал о разделении, но у меня было много [], что сделало его еще более уродливым. Я думал о раздевании, но мое регулярное выражение, но, похоже, ничего не делает. Есть предложения?
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
url_toscrape = "https://www.ntu.edu.sg/events/Pages/default.aspx"
response = urllib.request.urlopen(url_toscrape)
info_type = response.info()
responseData = response.read()
soup = BeautifulSoup(responseData, 'lxml')
events_absFirst = soup.find_all("div",{"class": "ntu_event_summary_title_first"})
date_absAll = tr.find_all("div",{"class": "ntu_event_summary_date"})
events_absAll = tr.find_all("div",{"class": "ntu_event_summary_title"})
for first in events_absFirst:
print('-',first.text.strip())
print (' ',date)
for tr in soup.find_all("div",{"class":"ntu_event_detail"}):
date_absAll = tr.find_all("div",{"class": "ntu_event_summary_date"})
events_absAll = tr.find_all("div",{"class": "ntu_event_summary_title"})
for events in events_absAll:
events = events.text.strip()
for date in date_absAll:
date = date.text.strip('^Time.*')
print ('-',events)
print (' ',date)