Преобразование символов "UTF-8" в ASCII в строке? - PullRequest
0 голосов
/ 02 апреля 2020

CSV-файл имеет четыре столбца: - tweet_id, созданный_кат, tweet_text, tweet_media_url

tweet_text уже в кодировке UTF-8

import csv
f = open('tweets.csv')
csv_f = csv.reader(f)
#==============================================================================
tweet_text= []
for row in csv_f:
    tweet_text.append(row[2])
#==============================================================================
def deEmojify(inputString):
    inputString= inputString.encode('ascii', 'ignore').decode('ascii')
    return inputString
#===============================================================================
text1="b'@JWSpry Have some fun with this! \xf0\x9f\x98\x82 I can only post four at a time - a few more are coming."
text2=deEmojify(text1)
print(text2)

output - b '@ JWSpry Повеселись с этим! Я могу публиковать только четыре сообщения одновременно - еще несколько.

print(tweet_text[7])

output -b '@ JWSpry Повеселись с этим! \ xf0 \ x9f \ x98 \ x82 Я могу публиковать только четыре сообщения одновременно - еще несколько.

text3=deEmojify(tweet_text[7])
print(text3)

output -b '@ JWSpry Повеселись с этим! \ xf0 \ x9f \ x98 \ x82 Я могу публиковать только четыре за один раз - еще несколько.

почему код работает нормально для text1 (который я только что скопировал и вставил из csv) но не для tweet_text [7]?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...