Удаление тегов (<td>, <tr>и <p>из кадра данных, а затем экспорт в CSV и отправку по электронной почте - PullRequest
0 голосов
/ 03 ноября 2019

Я учусь и расстроен новичком в Python! Я пытаюсь извлечь результаты футбольных матчей с нашего школьного веб-сайта и отправить их по электронной почте списку родителей, чтобы они могли оставаться в курсе прогресса команды. Я создал фрейм данных и попытался экспортировать, но все теги проходят, и данные перемешиваются. Я даже не перешел к рассылке, но постараюсь узнать об этом на следующем шаге. Спасибо за любую помощь!

from bs4 import BeautifulSoup
import requests
import csv
import pandas as pd


url = "https://southkentschool.org/athletics/teams/varsity-soccer/schedule-scores"
html_content = requests.get(url).text

soup = BeautifulSoup(html_content, "lxml")

data_source = soup.find("div", attrs={"class": "ss-content-block"})
data_table = data_source.tbody.find_all("tr")  
print(type(data_table))
print(data_table)

df = pd.DataFrame(data_table)
print(df)
export_csv = df.to_csv (r'export_dataframe.csv', index = None, header=True) 
...