У меня есть куча HTML-кода, который я анализирую с BeautifulSoup, и он идет довольно хорошо, за исключением одной незначительной ошибки. Я хочу сохранить выходные данные в виде строки с одной строкой, в которой в качестве текущего вывода используется следующее:
<li><span class="plaincharacterwrap break">
Zazzafooky but one two three!
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky2
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky3
</span></li>
В идеале я бы хотел
<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>
Есть много лишних пробелов, от которых я хотел бы избавиться, но их не обязательно удалять с помощью strip()
, и при этом я не могу явно удалить все пробелы, потому что мне нужно сохранить текст. Как мне это сделать? Кажется, это достаточно распространенная проблема, что регулярное выражение будет излишним, но разве это единственный способ?
У меня нет тегов <pre>
, поэтому я могу быть немного более энергичным.
Еще раз спасибо!