удаление ссылок из набора данных - PullRequest
0 голосов
/ 06 апреля 2020

У меня есть следующий набор данных, и мне нужно удалить все ссылки из него. CSV выглядит так:

data

Кто-нибудь знает, как я могу быстро и легко это сделать?

1 Ответ

1 голос
/ 06 апреля 2020

Вы можете использовать регулярное выражение в python следующим образом:

import re 

for x in list :
     re.sub("http\S*\s", "", x)

, где list - это список ваших данных CSV.

Этот код я использую для предварительной обработки данных Twitter:

all_text  = re.sub("#\S*\s", "", all_text)
all_text  = re.sub("W+", "", all_text)
all_text  = re.sub("@\S*\s", "", all_text)
all_text  = re.sub("http\S*\s", "", all_text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...