Удаление пробелов и новых строк между тегами в html (он же неформатирован) в python - PullRequest
2 голосов
/ 22 июня 2010

Пример:

<p> Hello</p>
<div>hgello</div>
<pre>
   code
    code
<pre>

превращается во что-то вроде:

<p> Hello</p><div>hgello</div><pre>
    code
     code
<pre>

Как это сделать в python? Я также интенсивно использую теги

, поэтому замена всех '\ n' на 'не возможна. 

 Какой лучший способ сделать это? 

Ответы [ 2 ]

5 голосов
/ 22 июня 2010

Вы можете использовать re.sub(">\s*<","><","[here your html string]").

Может быть, string.replace(">\n",">"), то есть найдите заключающую скобку и новую строку и удалите новую строку.

3 голосов
/ 22 июня 2010

Я бы выбрал регулярное выражение Python:

string.replace(">\s+<","><")

Где '\ s' находит любой символ пробела, а '+' после того, как он показывает, что он соответствует одному или нескольким символам пробела.Это исключает возможность замены вместо

<pre>
    code
     code
<pre>

на

<pre><pre>

Более подробную информацию о регулярных выражениях можно найти здесь , здесь и здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...