В текстовом файле (test.txt) моя строка выглядит следующим образом:
Gro\u00DFbritannien
Читая его, Python избегает обратной косой черты:
>>> file = open('test.txt', 'r')
>>> input = file.readline()
>>> input
'Gro\\u00DFbritannien'
Как я могу интерпретировать это как юникод? decode()
и unicode()
не справятся с работой.
Следующий код записывает Gro\u00DFbritannien
обратно в файл, но я хочу, чтобы он был Großbritannien
>>> input.decode('latin-1')
u'Gro\\u00DFbritannien'
>>> out = codecs.open('out.txt', 'w', 'utf-8')
>>> out.write(input)