Я использую метод BeauitfulSoup get_text()
в теге span, вызывая мою функцию parse_text как
date = parse_text(soup.find('span'))
, а затем вставляя дату рядом с некоторыми данными в словаре для использования с pandas как
data['date'] = [date] * number_rows
Затем я создаю фрейм данных pandas из словаря и вызываю .to_csv в фрейме данных, но в файле csv все даты отображаются как «27 мая 2020 г.», а не только 27 мая 2020 г.
вот функция parse_text и html
parse_text(element):
return element.get_text().replace('\n', ' ').strip()
<span>May 27, 2020</span>