У меня возникли проблемы с получением Python для правильной обработки текста в Unicode.
Я свел его к следующему:
>>>print 'Høst'
Høst
>>>print u'Høst'
HÃ,st
>>>u = u'Høst'
>>>u
u'H\xf8st'
sys.stdout.encoding говоритчто он использует UTF-8, что, скорее всего, и работает первая, не-Unicode, печать.Если мне просто нужно что-то напечатать, то это будет хорошо.Однако я создаю документ xml из данных на SQL Server, и тогда он действительно должен быть настоящим юникодом.
Мои данные выглядят так, как будто они очень хороши для данных юникода, u'H \ xf8st 'выглядит правильномне, так почему Python продолжает выводить его как 'HÃ, st'?