Я перебираю веб-сайт с помощью Python selenium.Это код на веб-сайте:

, и я хотел бы, чтобы тексты выглядели так, как показано на сайте, то есть легко читались с помощьюразрывы строк, в организованном формате.
Я пытался использовать
driver.find_element_by_class_name('record-content.record-information.record-content_j').text
, но внутри \ n \ n символов.Я попробовал print(text)
, и выглядит лучше.Но есть ли способ сохранить текст в кадре данных или что-то еще, чтобы он был сохранен в организованном формате.Веб-сайт выглядит так:
Когда я пытался
rawData=driver.find_element_by_class_name('record-content.record-information.record-content_j').text
sanitizedData = rawData.replace('\n','')
print(BeautifulSoup(sanitizedData, 'html.parser').prettify())
Вывод выглядит так:
The 'br 'теги для разрывов строк просто исчезли.