Как правильно заменить (удалить) некоторую информацию из CSV файла, используя python? - PullRequest
1 голос
/ 09 мая 2020

Я хочу удалить некоторую информацию из файла CSV, но у меня возникли проблемы.

Ниже приводится информация о моем файле CSV.

enter image description here

Я использовал re.sub, чтобы удалить некоторую информацию, но я удалю не те вещи.

Следующий код мой пример:

new_html_code = re.sub('" target="_blank">.*</a>', " ", new_html_code)

Я хочу удалить только следующий код HTML:

image

Однако мой код удалит больше информации. Будет удалена следующая информация:

image

У меня много </a> в каждом поле. Я знаю, что мой код определяет последний </a>. Я хочу, чтобы он обнаруживал первый </a>, а не последний </a>.

1 Ответ

3 голосов
/ 09 мая 2020

Добавление? решит вашу проблему таким образом, чтобы ваше регулярное выражение не было жадным. Но он обнаружит все шаблоны, которых в вашем случае есть 3.

Попробуйте что-то вроде этого: " target="_blank">.*?</a>

new_html_code = re.sub('" target="_blank">.*</a>', " ", new_html_code)

new_html_code = re.sub('" target="_blank">.*?</a>', " ", new_html_code ,1)

Параметр 1 заменяет только первый член.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...