как читать этот текст из файла - PullRequest
0 голосов
/ 22 мая 2011

как читать текст ниже?

‰ € ˆ ‡ ‰ # îõ‘þüŠ ꑯõù ‚† ƒ - # ª ÷‘ “ü “‘ ª “îù) øþ¦ùý ¤ª — ùý î‘õ • #ø — ¤ (# • ¢ þ ¢ ø¤ ÷ ¢ ù ‘‘¯õù îõ‘þü # ^ a — ú¤ ö ^ b • ¦øû ÷ ¢ ð‘ö ^ ¢ ÷ © ^ cˆˆƒ # ‚€ «.: Õ¬ø¤Š > ¢ ØÑ # ...... I / S ... / ... € ... Š} TK {^ aƒ # † / «€€ #} {# BF ª» îùû'ý •‘õ • —ø — ¤ý # ª “îùû‘ý î‘õ • þø — ¤ý - # ¥ õøöû»^ с

Я использую этот код, но не отображаю все символы

FileStream fs = new FileStream(open.FileName, FileMode.Open, FileAccess.Read);
        System.Text.Encoding enc = System.Text.Encoding.UTF8 ;
        byte[] data = new byte[fs.Length];
        fs.Read(data, 0, data.Length);
        string text = enc.GetString(data);

и показать текст:

â € â € Ë € € à ¾ ¾ ¾ ¾ ¼ ¼ ¼ ¼ ê⠀ ˜Â¯ÃµÃ¹ â € â € â’ - #  ªà · â € ˜Ã¾Ã¼ â € œ  ⠀ œÃ®Ã¹) øþ¦ùý  ¤ ª € ¹ ½ ½ â â â â ¾ ¾ ¤ ¤ # # (# â € ¢ þ ¢  ø¤à ·  ¢ ù ê⠀ ˜Â¯ÃµÃ¹ îÃμâ € ~þü # ^ Ä €»ÃºÂ¤Âö ^ b â ¦ ¦ ¦ · à à à ˜ ˜ ˜  ·  © ^ c ^ † Ë † Æ’Â # â € šâ ‚¬Â « .: õ¬ø¤Š⠀ ºÂ ¢ øà ± # â € ¦Â â € ¦Ë † à / Å â € ¦ / â € ¬â‚¬Â â € ¦Å} TK {^ aË † Ë † Æ’Â # # € / â € žâ‚¬â‚¬ #} BF {# ª⠀ œÃ®Ã¹Ã »â € ˜Ã½ î⠀ ~Ãμâ € ¢ þø⠀»Â¤Ã½ #  ⠀ œÃ®Ã¹Ã »â € ˜Ã½ î⠀ ˜Ãµ

это ТЕКСТ ДОС и кодировка этого текста:

IBM037

IBM437

IBM500

ASMO-708

DOS-720

ibm737

ibm775

ibm850

ibm852

IBM855

ibm857

IBM00858

IBM860

ibm861

DOS-862

IBM863

IBM864

IBM865

cp866

ibm869

IBM870

windows-874

cp875

shift_jis

gb2312

ks_c_5601-1987

big5

IBM1026

IBM01047

IBM01140

IBM01141

IBM01142

IBM01143

IBM01144


IBM01145

IBM01146

IBM01147

IBM01148

IBM01149

utf-16

unicodeFFFE

windows-1250

windows-1251

Windows-1252

windows-1253

windows-1254

windows-1255

windows-1256

windows-1257

windows-1258

Johab

macintosh

x-mac-japanese

x-mac-chinesetrad

x-mac-korean

x-mac-arabic

x-mac-hebrew

x-mac-greek

x-mac-cyrillic



x-mac-chinesesimp

x-mac-romanian

x-mac-ukrainian

x-mac-thai

x-mac-ce

x-mac-icelandic

x-mac-turkish

x-mac-croatian

utf-32

utf-32BE

x-Chinese-CNS

x-cp20001

x-Chinese-Eten

x-cp20003

x-cp20004

x-cp20005

x-IA5

x-IA5-German

x-IA5-Swedish

x-IA5-Norwegian

us-ascii

x-cp20261

x-cp20269

IBM273

IBM277

IBM278

IBM280

IBM284

IBM285

IBM290

IBM297

IBM420

IBM423

IBM424

x-EBCDIC-KoreanExtended

IBM-Thai

koi8-r

IBM871

IBM880

IBM905

IBM00924

EUC-JP

x-cp20936

x-cp20949

cp1025

koi8-u

iso-8859-1

iso-8859-2

iso-8859-3

iso-8859-4

iso-8859-5

iso-8859-6

iso-8859-7

iso-8859-8

iso-8859-9

iso-8859-13

iso-8859-15

x-Europa

iso-8859-8-i

iso-2022-jp

csISO2022JP

iso-2022-jp

iso-2022-kr

x-cp50227

euc-jp

EUC-CN

euc-kr

hz-gb-2312

GB18030

x-iscii-de

x-iscii-be

x-iscii-ta

x-iscii-te

x-iscii-as

x-iscii-or

x-iscii-ka

x-iscii-ma

x-iscii-gu

x-iscii-pa

utf-7

utf-8

Ответы [ 2 ]

3 голосов
/ 22 мая 2011

Чтобы прочитать файл, вам необходимо знать, какая кодировка используется в этом файле.

Если вы не знаете, вы можете пройтись по всем кодировкам и посмотреть, найдете ли тот, который работает.

const string FileName = "FileName";
foreach (var encodingInfo in Encoding.GetEncodings())
{
    try
    {
        var encoding = encodingInfo.GetEncoding();
        var text = File.ReadAllText(FileName, encoding);
        Console.WriteLine("{0} - {1}", encodingInfo.Name, text.Substring(0, 20));

        // put break point and check if text is readable here
    }
    catch (Exception ex)
    {
        Console.WriteLine("Failed: {0}", encodingInfo.Name);
    }
}

Отказ от ответственности: предполагая, что это текстовый файл, предполагая, что файл не большой.

0 голосов
/ 22 мая 2011

Похоже, вы пытаетесь открыть файл .dat, который, вероятно, записан в байтовом формате

Попробуйте следующий код

        File readThis = new File("file directory");
        byte[] aByte = new byte[(int)readThis.length()];
        FileInputStream Fis = new FileInputStream(readThis);
        Fis.read(aByte);
        System.out.println(Contents: "+aByte);
        Fis.close();

Дайте мне знать, как это происходит:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...