Python3: конвертировать строку апостроф юникод - PullRequest
0 голосов
/ 04 декабря 2018

У меня есть строковое значение с апострофом, например:

"I\\xE2\\x80\\x99m going now."

Как получить правильное значение апострофа?

"I`m going now."

Как вы знаете, \xE2\x80\x99 являетсясимвол Unicode U+2019 RIGHT SINGLE QUOTATION MARK, но вместо байта у меня есть строковое представление ...

1 Ответ

0 голосов
/ 09 февраля 2019

Возможно, это то, что вам нужно:

utf8_apostrophe = b'\xe2\x80\x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"

В сторону: я столкнулся с этим при преобразовании одиночной кавычки в твите с кодировкой UTF-8 в обычную одинарную кавычку.

import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)

, который производит

I'm going now
...