Когда вы пишете .get_text()
, вы можете использовать .get_text().strip()
для удаления пробелов.
Вы храните несколько столбцов, которые могут работать достаточно хорошо, вы можете объединить их с zip(x, y)
если нужно. Но вам может быть удобнее попросить BeautifulSoup найти таблицу, а затем find_all('tr')
внутри таблицы, то есть выполнить итерацию по строкам.
Рассмотрим представление (часть) строки таблицы следующим образом:
row = dict(opponent='vs. Northfield Mt. Hermon',
advantage='Home',
score='1-1')
Если у вас есть объект tr, строка таблицы, вы можете легко найти эти значения.
Имея это в виду, вы можете представить всю таблицу в виде списка строк,каждая строка представляет собой dict
.
Затем выведите строки в электронную таблицу, как вы это делали. Или $ pip install pandas
и вы можете сделать :
rows = read_html_table_rows()
df = pandas.Dataframe(rows)
df.to_excel('results.xls')