Я хочу сохранить текст твитов только в урду, сейчас все работает нормально, твиты сохраняются в формате csv, мне просто нужно очистить данные при сохранении в файле csv
текст твитов сохраняется в этом формате
@ hinaparvezbuttخ
мне просто нужно сохранить текст, подобный этому
* 1015
хотя я использовал регулярное выражение для очистки текста, но мне не удалось сохранить его в массиве твитов
это мой код
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
# set access token and secret
auth.set_access_token(access_token, access_secret)
# create tweepy API object to fetch tweets
api = tweepy.API(auth,wait_on_rate_limit=True)
tweets = []
for tweet in tweepy.Cursor(api.search,q="اردو"+" -filter:retweets",count=1000).items(1000):
text=re.sub(r"[#.A-Za-z0-9@;:/\n]", "", tweet.text, flags=re.UNICODE)
tweets.append(tweet)
tweets_df = pd.DataFrame(vars(tweets[i]) for i in range(len(tweets)))
FILE_PATH = "mysample.csv"
tweets_df.to_csv(FILE_PATH)
tweet_atts = [
'text', 'created_at', 'favorite_count',
'lang', 'retweet_count', 'source',
'in_reply_to_user_id_str', 'retweeted',
'id'
]
tweets_df = tweets_df[tweet_atts]
tweets_df.to_csv(FILE_PATH)