Мой CSV-файл хранится с закодированными данными utf-8, но не декодируется в исходную форму данных.
декодирование работает для отдельных объектов, но не для файловых объектов
фактические данные:
печать (данные [ 'Текст'] [100])
b'RT @MeherKhanAnsari: Поскольку мы были свидетелями путешествия Шехзада Салима, мы буквально получили возможность увидеть столько слоев этого персонажа \ xf0 \ x9f \ x98 \ x8dЯ должен сказать \ xe2 \ x80 \ xa6 '
ошибка декодирования:
печать (данные [ 'Текст'] [100] .decode ( 'UTF-8'))
AttributeError Traceback (последний вызов был последним)
в ()
----> 1 отпечаток (данные ['Текст'] [100] .decode ('utf-8'))
AttributeError: у объекта 'str' нет атрибута 'decode'
если я возьму в объект то его поддержку для декодирования
X = b'RT @MeherKhanAnsari: Поскольку мы стали свидетелями путешествия Шехзада Салима, мы буквально получили возможность увидеть очень много слоев этого персонажа \ xf0 \ x9f \ x98 \ x8dЯ должен сказать \ xe2 \ x80 \ xa6 '
X.decode ( 'UTF-8')
'RT @MeherKhanAnsari: Поскольку мы стали свидетелями путешествия Шехзада Салима, мы буквально увидели так много слоев этого персонажа… Я должен сказать…'
декодирование для всех данных, таких как
'RT @MeherKhanAnsari: Поскольку мы стали свидетелями путешествия Шехзада Салима, мы буквально увидели так много слоев этого персонажа… Я должен сказать…'