Как использовать регулярные выражения заменить, чтобы заменить специальный символ? - PullRequest
0 голосов
/ 24 марта 2020

Я пытаюсь заменить "\" на \ используя регулярное выражение, но не могу найти правильное решение. Хотите удалить двойные кавычки, которые идут вокруг. Не могли бы вы помочь мне, как это сделать?

Пример:

"\""warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"

В результате:

\"warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"

Ответы [ 2 ]

0 голосов
/ 24 марта 2020

Попробуйте решение ниже:

df = spark.createDataFrame([
    (1, '"\\""warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"')
], ("ID","textVal"))

import pandas as pd
from  pyspark.sql.functions import regexp_replace, col
pd.set_option('max_colwidth', 200)

df2 = df.withColumn('textVal', regexp_replace(col('textVal'), '\\"\\\\\"', '\\\\')) 
df2.toPandas()


ID  textVal
0   1   \"warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"

Надеюсь, это поможет!

0 голосов
/ 24 марта 2020

Решает ли это вашу проблему?

re.sub(r'"\\"', r'\\', text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...