Проблема здесь в том, что ваша строка является Python-представлением объекта Python bytes
, который практически бесполезен.
Скорее всего, у вас был объект bytes
, например:
b = b'@DerkGently @seanferg85 @Umbertobaggio @EL4JC and he already had Popular support.. most people know this already. A\xe2\x80\xa6 '
… и вы преобразовали его в строку, например:
s = str(b)
Не делай этого. Вместо этого расшифруйте его:
s = b.decode('utf-8')
Это даст вам фактические символы, которые вы можете затем легко сопоставить, вместо того, чтобы пытаться сопоставить символы в строковом представлении представления байтов, а затем трудоемко восстанавливать действительные символы из результатов.
Тем не менее, стоит отметить, что \xe2\x80\xa6
- это не эмодзи, это символ горизонтального многоточия …
. Если это не то, что вы хотели, вы уже испортили данные до этого момента.