BeautifulSoup get_text () метод для диапазона, возвращающий кавычки как часть строки - PullRequest
0 голосов
/ 28 мая 2020

Я использую метод BeauitfulSoup get_text() в теге span, вызывая мою функцию parse_text как

date = parse_text(soup.find('span'))

, а затем вставляя дату рядом с некоторыми данными в словаре для использования с pandas как

data['date'] = [date] * number_rows

Затем я создаю фрейм данных pandas из словаря и вызываю .to_csv в фрейме данных, но в файле csv все даты отображаются как «27 мая 2020 г.», а не только 27 мая 2020 г.

вот функция parse_text и html

   parse_text(element):
       return element.get_text().replace('\n', ' ').strip()

<span>May 27, 2020</span>

1 Ответ

0 голосов
/ 28 мая 2020

быстро после публикации этого сообщения я понимаю, что pandas .to_csv вставляет кавычки из-за присутствующей запятой в строке, поскольку это разделитель для файла ... facepalm *

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...