как заменить знак вопроса на слово - PullRequest
1 голос
/ 24 марта 2019

У меня арабский твит, и я хочу заменить вопросительные знаки и восклицательный знак на синоним арабского слова. Я попробовал этот код, я использовал регулярное выражение, но ничего не происходит. Я использовал ноутбук Jupyter

def replace_questionmark(tweet):
text = re.sub("!", "تعجب",tweet)
text = re.sub('استفهام','؟' ,tweet)
return tweet

data_df['clean text'] = data_df['Text'].apply(lambda x: replace_questionmark(x))

1 Ответ

0 голосов
/ 29 марта 2019

Следующий код решает вашу проблему

import pandas as pd
import re

Text = [u'I am feeling good !', u'I am testing this code ؟']
data_df = pd.DataFrame(columns=['Text'], data=Text)

def replace_questionmark(tweet):
    text = tweet.replace(u'!', u'تعج')
    text = text.replace(u'؟', u'استفهام')
    return text.encode('utf-8')

data_df['clean text'] = data_df['Text'].apply(lambda x: replace_questionmark(x))

print(data_df)

Выход

                       Text                      clean text
0       I am feeling good !           I am feeling good تعج
1  I am testing this code ؟  I am testing this code استفهام
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...