Как удалить все значения эмодзи из строк в python 3? - PullRequest
1 голос
/ 26 апреля 2020

Я пытаюсь написать программу, которая будет получать твиты, а затем вставлять их в CSV-файл, но я получаю эту ошибку:

Traceback (most recent call last):
  File "c:/Users/Fateh Aliyev/Desktop/Python/AI/Data Mining/data.py", line 30, in <module>
    csv.writerow([text, 0])
  File "C:\Python\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\U0001f44c' in position 41: character maps to <undefined>

Я уверен, что это из смайликов, которые находятся в строки. Я попытался это решение , но я получил ту же ошибку. Это вызвано тем, что python не может изначально кодировать строку или что-то еще? Как избавиться от смайликов?

1 Ответ

1 голос
/ 26 апреля 2020

Вы можете удалить эмодзи, игнорируя его, когда он не может быть закодирован:

import codecs

codecs.charmap_encode('\U0001f44c', 'ignore') 

# outputs: (b'', 1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...