У меня есть следующий XML-документ:
<package>
<title>セレニティー (字幕版)</title>
...
</package>
Я использую lxml
для анализа заголовка следующим образом:
node = etree.fromstring(file_contents)
title = node.xpath("//t:title/text()")
title
[u' \u30bb\u30ec\u30cb\u30c6\u30a3\u30fc (\u5b57\u5e55\u7248)']
Однако, когда я INSERT
это вмоя база данных использует title.encode(utf-8)
, я получаю тарабарщину:
セレニティー (å—幕版)
Как бы я правильно проанализировал title
здесь (セ セ ニ テ ィ ー (字幕 版)), чтобы я мог сделать INSERT
от значения.