У меня есть программа, которая вводит текст и сортирует его, используя ряд функций, и текст должен быть читаемым независимо от формата, однако, когда импортируется файл, сохраненный в расширенной кодировке ASCII, любые символы свыше 127 игнорируются,Оглядываясь вокруг, я не вижу, как это преодолеть.Файлы хорошо читаются в UTF-8 и Unicode.Я пытался преобразовать строки в UTF-8, но рассматриваемые буквы по-прежнему просто представляют собой вопросительные знаки, похожие на фигуры.Я вижу, что значения верны: 0xBF для û, но они не интерпретируются как значения.
Может ли кто-нибудь помочь мне здесь, я не проделал много работы с такого рода вещами раньше.Я работаю в C #, если это поможет.
Мой текущий код для преобразования выглядит следующим образом:
System.Text.UTF8Encoding u = new System.Text.UTF8Encoding();
byte[] asciiBytes = Encoding.UTF8.GetBytes(sd);
sd = u.GetString(asciiBytes);
Где sd
- строка.Когда я импортирую эту строку, я не указываю кодировку текста:
string input = File.ReadAllText(fname);
...
parser(input);