Эти данные поступают из базы данных Oracle и извлекаются в плоские файлы в кодировке 'WE8MSWIN1252'.
Я хочу проанализировать данные и провести некоторый анализ. Я хочу видеть текстовые поля, но мне не нужно публиковать результаты в любой другой системе, поэтому, если некоторые символы не конвертируются идеально, у меня нет проблем с этим.
Я просто не хочу, чтобы мой синтаксический анализ завершился неудачно с ошибкой декодирования, которую я получаю, если использую:
inputFile = codecs.open (dataFileName, "r", "utf-8 '")