Question

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wb") as outfile:
    outfile.write(plaintext)

Приведенный выше код Python дает мне следующую ошибку:

Traceback (most recent call last):
  File "C:/Users/Ankur Gupta/Desktop/Python_works/gzip_work1.py", line 33, in <module>
    compress_string()
  File "C:/Users/Ankur Gupta/Desktop/Python_works/gzip_work1.py", line 15, in compress_string
    outfile.write(plaintext)
  File "C:\Python32\lib\gzip.py", line 312, in write
    self.crc = zlib.crc32(data, self.crc) & 0xffffffff
TypeError: 'str' does not support the buffer interface

Michał Niklas · Answer 1 · 29 марта 2011

Если вы используете Python3x, то string отличается от типа Python 2.x, вы должны преобразовать его в байты (закодировать).

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wb") as outfile:
    outfile.write(bytes(plaintext, 'UTF-8'))

Также не используйте имена переменных, такие какstring или file, в то время как это имена модулей или функций.

EDIT @ Tom

Да, текст не ASCII также сжимается / распаковывается.Я использую польские буквы с кодировкой UTF-8:

plaintext = 'Polish text: ąćęłńóśźżĄĆĘŁŃÓŚŹŻ'
filename = 'foo.gz'
with gzip.open(filename, 'wb') as outfile:
    outfile.write(bytes(plaintext, 'UTF-8'))
with gzip.open(filename, 'r') as infile:
    outfile_content = infile.read().decode('UTF-8')
print(outfile_content)

user1175849 · Answer 2 · 21 июля 2014

Существует более простое решение этой проблемы.

Вам просто нужно добавить t в режим, чтобы он стал wt. Это заставляет Python открывать файл как текстовый файл, а не как двоичный файл. Тогда все будет просто работать.

Полная программа становится такой:

plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wt") as outfile:
    outfile.write(plaintext)

Andreas Jung · Answer 3 · 29 марта 2011

Вы не можете сериализовать 'строку' Python 3 в байты без явного преобразования в некоторую кодировку.

outfile.write(plaintext.encode('utf-8'))

- это то, что вам нужно.Также это работает для Python 2.x и 3.x.

Skurmedel · Answer 4 · 29 марта 2011

Для Python 3.x вы можете конвертировать ваш текст в необработанные байты через:

bytes("my data", "encoding")

Например:

bytes("attack at dawn", "utf-8")

Возвращенный объект будет работать с outfile.write.

Riaz Rizvi · Answer 5 · 09 января 2016

Эта проблема обычно возникает при переключении с py2 на py3. В py2 plaintext используется тип string и байтовый массив . В py3 plaintext есть только строка , а метод outfile.write() фактически принимает массив байтов , когда outfile открывается в двоичном режиме, поэтому возникает исключение. Измените ввод на plaintext.encode('utf-8'), чтобы решить проблему. Читайте дальше, если это вас беспокоит.

В py2 объявление для file.write создает впечатление, что вы передали строку: file.write(str). На самом деле вы передавали байтовый массив, вы должны были прочитать объявление так: file.write(bytes). Если вы читаете это так, проблема проста: file.write(bytes) нужен тип байтов , а в py3 для получения байтов из str вы конвертируете его:

py3>> outfile.write(plaintext.encode('utf-8'))

Почему документы py2 объявили, что file.write взяла строку? Ну, в py2 различие в объявлении не имело значения, потому что:

py2>> str==bytes         #str and bytes aliased a single hybrid class in py2
True

Класс py2 str-bytes имеет методы / конструкторы, которые в некоторых отношениях ведут себя как класс строк, а в других - как класс байтовых массивов. Удобно для file.write не так ли?:

py2>> plaintext='my string literal'
py2>> type(plaintext)
str                              #is it a string or is it a byte array? it's both!

py2>> outfile.write(plaintext)   #can use plaintext as a byte array

Почему py3 сломал эту замечательную систему? Ну, потому что в py2 основные строковые функции не работали для остального мира. Измерить длину слова не-ASCII символом?

py2>> len('¡no')        #length of string=3, length of UTF-8 byte array=4, since with variable len encoding the non-ASCII chars = 2-6 bytes
4                       #always gives bytes.len not str.len

Все это время, когда вы думали, что просите len строки в py2, вы получали длину байтового массива из кодировки. Эта двусмысленность является фундаментальной проблемой классов с двумя обязанностями. Какую версию любого вызова метода вы реализуете?

Хорошая новость в том, что py3 решает эту проблему. Он разбивает классы str и bytes . Класс str имеет строковые методы, отдельный класс bytes имеет методы байтового массива:

py3>> len('¡ok')       #string
3
py3>> len('¡ok'.encode('utf-8'))     #bytes
4

Надеюсь, знание этого поможет разобраться в проблеме и немного облегчит перенос боли.

Aaron Lelevier · Answer 6 · 17 августа 2015

Для Django в django.test.TestCase модульном тестировании я изменил свой синтаксис Python2 :

def test_view(self):
    response = self.client.get(reverse('myview'))
    self.assertIn(str(self.obj.id), response.content)
    ...

Чтобы использовать синтаксис Python3 .decode('utf8'):

def test_view(self):
    response = self.client.get(reverse('myview'))
    self.assertIn(str(self.obj.id), response.content.decode('utf8'))
    ...

Tapasit Suesasiton · Answer 7 · 08 июля 2015

>>> s = bytes("s","utf-8")
>>> print(s)
b's'
>>> s = s.decode("utf-8")
>>> print(s)
s

Хорошо, если это полезно для вас в случае удаления раздражающего символа 'b'. Если у кого-то есть идея получше, пожалуйста, предложите мне или не стесняйтесь редактировать меня в любое время здесь. Я просто новичок

Ошибка типа: 'str' не поддерживает интерфейс буфера

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Ошибка типа: 'str' не поддерживает интерфейс буфера

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов