Question

Когда я пытаюсь найти количество слов в строке UTF-8, я получаю следующее:

UnicodeEncodeError
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128)

Это то, что я делаю

tr.words_count = (str(tr.transcribe).count(' '))

Мне нужно посчитать, сколько слов в тексте UTF-8, и кажется, что мой метод не сработает. Есть ли у вас какие-либо идеи? Спасибо

Amber · Answer 1 · 12 января 2012

str(tr.transcribe.decode('utf-8'))

Или еще лучше,

unicode(tr.transcribe).count(' ')

Или даже лучше (чтобы не запутаться, если в строке несколько пробелов),

len(unicode(tr.transcribe).split())

UnicodeEncodeError Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.