Люди
Я новичок в Python и BeautifulSoup - поэтому, пожалуйста, потерпите меня. Я пытаюсь сделать html-разбор.
Я хотел бы удалить символы новой строки и компактные пробелы из выбранных атрибутов (на основе поиска строки в файле html.
Например, для следующего html я хотел бы найти все теги со строковым атрибутом «xy», а затем удалить из этой строки символы новой строки и несколько пробелов (заменить на один пробел.
<html>
<head></head>
<body>
<h1>xy
z</h1>
<p>xy
z</p>
<div align="center" style="margin-left: 0%; ">
<b>
<font style="font-family: 'Times New Roman', Times">
ab c
</font>
<font style="font-family: 'Times New Roman', Times">
xy z
</font>
</b>
</div>
</body>
</html>
Полученный HTML должен выглядеть так:
<html>
<head></head>
<body>
<h1>xy z</h1>
<p>xy z</p>
<div align="center" style="margin-left: 0%; ">
<b>
<font style="font-family: 'Times New Roman', Times">
ab c
</font>
<font style="font-family: 'Times New Roman', Times">
xy z
</font>
</b>
</div>
</body>
</html>