У меня недостаточно информации, чтобы дать вам хороший ответ, но вот несколько предположений, которые могут вам немного помочь.
Я думаю, что вы должны использовать Python 3.x, потому чтоUnicode действительно хорошо интегрирован.Если вы используете Python 2, ваш вызов outfile.write()
получает строку байтов, и я не уверен, будет ли эта строка правильной.Может быть, ваш текстовый редактор пишет UTF-8 в вашем исходном файле?Если это Python 2.x, возможно, вы отправляете UTF-8 для записи в виде ISO-8859-8, и, возможно, это неправильно.
Если ваш исходный файл - UTF-8, и вы используете Python 3, тогда я думаю, что ваша программа должна делать то, что вы ожидаете.
Если ваш исходный файл ISO-8859-8, а вы используете Python 2, то я все еще не уверен, что произойдет.Если ваш исходный файл ISO-8859-8, вы можете попробовать использовать open()
вместо codecs.open()
, и это может сделать правильную вещь.
Если вы добавите дополнительную информацию, которая может помочь мне понятьВ таком случае, пожалуйста, оставьте комментарий или вопрос под этим ответом, и StackOverflow скажет мне посмотреть здесь снова.
Действительно, я думаю, что лучшее, что нужно сделать, это использовать UTF-8 для файлов исходного кода иPython 3.