Как убрать - из значений в поле - python или pyspark - PullRequest
0 голосов
/ 05 ноября 2019

У меня есть поле, которое выглядит как

field1
231-206-2222
231-206-2344
231-206-1111
231-206-1111

Я пытался переформулировать его, но безрезультатно. Я новичок в этом, поэтому любые идеи помогут. Любые предложения? Ssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss Я попытался переформулировать это, но безрезультатно. Я новичок в этом, поэтому любые идеи помогут. Любые предложения? Ssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss Я попытался переформулировать это, но безрезультатно. Я новичок в этом, поэтому любые идеи помогут. Любые предложения? Ssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss

Ответы [ 2 ]

0 голосов
/ 05 ноября 2019

Есть много способов сделать это.

Демонстрация:

1) # где sub заменит дефис пустым пробелом

df = pd.DataFrame({'field1': ['123-456-999', '333-222-111']})
df['field1'] = df['field1'].apply(lambda x: re.sub(r'-', '', x))

2) # где \ D + будет соответствовать одной или нескольким нецифрам и удалятьэто

df['field1'] = df['field1'].str.replace(r'\D+', '')

3) # заменить - на пустое место

df['field1'] = df['field1'].str.replace('-', '')

Результат:

    field1
0   123456999
1   333222111
0 голосов
/ 05 ноября 2019

Мне кажется, что это датафрейм, если так, попробуйте это:

df['field1'].apply(lambda x: x.replace("-",""))
...