re.sub dataframe на python - PullRequest
       3

re.sub dataframe на python

1 голос
/ 08 февраля 2020

Я пытаюсь пересчитать URL (например, https или http) с помощью функции re.sub regex. Это данные внутри data.csv:

    username     timestamp        text
    xx            18:09           httpsasdadsa what
    xxx           18:09           httpsasdadsa where
    xxxx          18:07           httpsasdadsa when

мой код:

import string
string.punctuation
import pandas as pd
import re

df = pd.read_csv('data.csv')

for i in range (0-4586):
    data = (df['text'][i])
    x = re.sub("^https"," ", str(data))
    df['text'][i]= x

но ничего не делает, ничего не меняет. я хочу сделать это после повторного подсчета:

  username     timestamp        text
0 xx           18:09           what
1 xxx          18:09           where
2 xxxx         18:07           when

1 Ответ

0 голосов
/ 08 февраля 2020

Предположим, у нас есть фрейм данных:

df
    username    timestamp   text
0   xx          18:09       httpsasdadsa what
1   xxx         18:09       httpsasdadsa where
2   xxxx        18:07       httpsasdadsa when

Тогда вы можете попробовать:

df.loc[df.index<4586,"text"] = df.loc[df.index<4586,"text"].str.replace("^https.*\s","")
df

    username    timestamp   text
0   xx          18:09       what
1   xxx         18:09       where
2   xxxx        18:07       when
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...