Как заменить часть строки в python из файла CSV? - PullRequest
0 голосов
/ 01 мая 2020

Я использовал Selenium и веб-драйвер для сканирования некоторой информации и вывода файла csv

А затем я хочу использовать файл read csv для перехвата HTML кода и удаления части строки.

Я пытался использовать метод замены, чтобы удалить его, но это не удалось.

Ниже приведен пример html:

image

У меня много div class="ContentGrid". Однако не каждый div class="ContentGrid" имеет <blockquote>...</blockquote>. Поэтому мне нужно удалить все содержимое <blockquote>...</blockquote>

enter image description here

Ниже приведен мой ожидаемый результат:

<div class="ContentGrid">
    香港一年GDP 都3千幾億大美金
    <br>
    2成都6百幾
    <br>
    <br>
    <br>
</div>

<div class="ContentGrid">

    <br>
    施生只對聖誕卡有感覺。
    <br>
    <br>
    <br>
</div>

enter image description here

Кто-нибудь может мне помочь? Спасибо ~~~

1 Ответ

2 голосов
/ 01 мая 2020

Как насчет этого?

import re

html = """
blah blah blah
    <blockquote>
        blah blah blah
    </blockquote>
blah blah blah
"""

new_html = re.sub("<blockquote>.*</blockquote>", "", html, flags=re.DOTALL)

print(new_html)

re.sub заменяет строку, переданную ему в первом параметре, строкой, переданной ему во втором параметре. Третий параметр - это строка, которую вы хотите найти. . * Между кавычками означает выбор любого количества неопределенных символов, кроме переносов строк. Флаги = re.DOTALL заставят. включить разрывы строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...