Python получить размер строки Unicode - PullRequest
17 голосов
/ 09 ноября 2011

У меня есть бинарный файл. Этот файл содержит строку UTF-8. Более того, гарантируется, что эта строка - всего лишь одно слово. В Python, как я могу получить количество букв в этой строке?

Допустим, я открыл этот файл и прочитал байты:

bytes = open("1.dat", "rb").read()

Что мне делать, чтобы узнать длину (в байтах, а не в байтах) строки UTF-8?

1 Ответ

34 голосов
/ 09 ноября 2011
unicode_string = bytes.decode("utf-8")
print len(unicode_string)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...