Question

Есть ли основания предпочитать unicode(somestring, 'utf8') вместо somestring.decode('utf8')?

Я думал только о том, что .decode() является связанным методом, поэтому python может решить его более эффективно, но исправьте меня, если я ошибаюсь.

bruno desthuilliers · Answer 1 · 13 января 2009

Это легко оценить:

>>> from timeit import Timer
>>> ts = Timer("s.decode('utf-8')", "s = 'ééé'")
>>> ts.timeit()
8.9185450077056885
>>> tu = Timer("unicode(s, 'utf-8')", "s = 'ééé'") 
>>> tu.timeit()
2.7656929492950439
>>>

Очевидно, unicode() быстрее.

FWIW, я не знаю, откуда у вас впечатление, что методы будут быстрее - это совсем наоборот.

dF. · Answer 2 · 13 января 2009

Я бы предпочел 'something'.decode(...), так как тип unicode больше не существует в Python 3.0, в то время как text = b'binarydata'.decode(encoding) все еще действует.

unicode () и str.decode () для байтовой строки в кодировке utf8 (python 2.x)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

unicode () и str.decode () для байтовой строки в кодировке utf8 (python 2.x)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы