Удалить некоторые строки в датафрейме - PullRequest
0 голосов
/ 06 декабря 2018

Я пытаюсь удалить некоторые строки в фрейме данных, которые начинаются с Система:

Мой фрейм данных:

       A          B                                                                C
  French      house   Blablabla System:Microsoft Windows XP; Browser:Chrome 32.0.1700;
 English      house               my address: 101-102 bd Charles de Gaulle 75001 Paris
  French  apartment                                                    my name is Liam
  French      house                                                       Hello George!
 English  apartment              System:Microsoft Windows XP; Browser:Chrome 32.0.1700;

Я пытался:

def remove_lines():

    df['C'] = df['C'].str.replace(r'(\s+)(System:).+','')

    return df

Ничего не происходит ...

Хороший вывод:

       A          B                                                                C
  French      house                                                          Blablabla 
 English      house               my address: 101-102 bd Charles de Gaulle 75001 Paris
  French  apartment                                                    my name is Liam
  French      house                                                       Hello George!
 English  apartment              

Ответы [ 2 ]

0 голосов
/ 06 декабря 2018

Вы можете просто использовать функцию split на System и выбрать первую часть, например:

In [1936]: df.C = pd.DataFrame(df.C.str.split('System').tolist())[0]
In [1937]: df
Out[1937]: 
         A          B                                                  C
0   French      house                                         Blablabla
1  English      house  my address: 101-102 bd Charles de Gaulle 75001...
2   French  apartment                                    my name is Liam
3   French      house                                      Hello George!
4  English  apartment                                                   
0 голосов
/ 06 декабря 2018

Использование:

df.C = df.C.str.replace('System:.*','')
df.C
# 0                                           Blablabla 
# 1    my address: 101-102 bd Charles de Gaulle 75001...
# 2                                      my name is Liam
# 3                                        Hello George!
# 4                                                     
# Name: C, dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...