В питоне мне нужно убрать 1-ю букву - PullRequest
0 голосов
/ 08 ноября 2018

У меня большой массив данных, как показано ниже:

df1 (данные выборки)

a      name       keywords
1      ramesh     rrahul,rapple
2      venkat     rtemple
3      rajesh     rcake,rphone,rmaths
4      lamda      rcon
5      feast      rcamera,rtab

Я хочу удалить букву r, которая встречается в начале каждого слова в строках, которые состоят из слов, разделенных запятыми. Вывод должен быть таким, как показано ниже:

a      name       keywords
1      ramesh     rahul,apple
2      venkat     temple
3      rajesh     cake,phone,maths
4      lamda      con
5      feast      camera,tab

Ответы [ 3 ]

0 голосов
/ 08 ноября 2018

Используйте str.replace с шаблоном regex как:

import re
pat = re.compile(r'^r|(?<=,)[r]')
df['keywords'] = df.keywords.str.replace(pat,'')

Или:

df['keywords'] = df.keywords.str.replace(r'^r|(?<=,)[r]','')

print(df)
   a    name          keywords
0  1  ramesh       rahul,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab

Объяснение к регулярному выражению:

  1. ^r проверяет, есть ли r в начале строки.
  2. (?<=,)[r] проверять, есть ли r после каждого ,

Метод понимания списка с помощью jezrael быстрее, чем str.replace, тогда как, если у вас есть значения NULL / NaN, тогда str.replace может позаботиться о тех, у кого нет шума.

0 голосов
/ 08 ноября 2018
df["keywords"] = df["keywords"].apply(lambda x: ",".join([w[1:] if w[0] == "r" else w for w in x.split(",")]) )
df

a   name    keywords
1   ramesh  rahul,apple
2   venkat  temple
3   rajesh  cake,phone,maths
4   lamda   con
5   feast   camera,tab
0 голосов
/ 08 ноября 2018

Используйте понимание вложенного списка с join и split:

Примечание

При условии отсутствия значений NULL / NaNs.

df['keywords'] = [','.join(y[1:] for y in x.split(',')) for x in df['keywords']]
print (df)
   a    name          keywords
0  1  ramesh       rahul,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab

Если возможно, иногда не существует первой буквы с r, возможно немного изменить решение с помощью if-else:

print (df)
   a    name             keywords
0  1  ramesh            aa,rapple
1  2  venkat              rtemple
2  3  rajesh  rcake,rphone,rmaths
3  4   lamda                 rcon
4  5   feast         rcamera,rtab

df['keywords'] = [','.join(y[1:] if y[0] == 'r' 
                                 else y 
                                 for y in x.split(',')) for x in df['keywords']]
print (df)
   a    name          keywords
0  1  ramesh          aa,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...