Используя C #, как я могу разбить текстовый файл на несколько файлов - PullRequest
0 голосов
/ 11 января 2019

Как разделить текстовый файл, содержащий ASCII-код SOH и ETX, на несколько файлов?

Например, текстовый файл с именем 001234.txt, который я назвал, содержит следующее:

SOH {ABCDXZY} ETX

SOH {ABCDXZY} ETX

SOH {ABCDXZY} ETX

Я хотел бы разбить один текстовый файл на несколько текстовых файлов для каждого кода ASCII, который начинается с SOH и заканчивается ETX.

Имя отдельного текстового файла должно быть разбито на 101234.txt, 111234.txt..etc, и каждый из них содержит один контент, который начинается с SOH и заканчивается ETX.

Я ценю любую помощь.

с использованием System.IO; using System.Linq;

namespace ASCII_Split
{
    class Program
    {
        static void Main(string[] args)
        {
            var txt = "";
            const char soh = (char)1;
            const char eox = (char)3;
            var count = 1;
            var pathToFile = @"‪‪C:\Temp\00599060.txt";

            using (var sr = new StreamReader(pathToFile))
                txt = sr.ReadToEnd();

            while (txt.Contains(soh))
            {
                var outfil = Path.Combine(Path.GetDirectoryName(pathToFile), count.ToString("000"), "_fix.txt");
                var eInd = txt.IndexOf(eox);
                using (var sw = new StreamWriter(outfil, false))
                {
                    sw.Write(txt.Substring(1, eInd - 1));
                }
                txt = txt.Substring(eInd + 1);
                count++;
            }

        }
    }
}

Ответы [ 3 ]

0 голосов
/ 11 января 2019

Если вы используете SOH и ETX, вы имеете в виду соответствующие управляющие символы, здесь вы должны получить:

var txt = "";
const char soh = (char) 1;
const char eox = (char) 3;
var count = 1;
var pathToFile = @"C:\00_Projects_temp\test.txt";

using (var sr = new StreamReader(pathToFile))
    txt = sr.ReadToEnd();

while (txt.Contains(soh))
{
    var outfil = Path.Combine(Path.GetDirectoryName(pathToFile), count.ToString("000"), "_test.txt");
    var eInd = txt.IndexOf(eox);
    using (var sw = new StreamWriter(outfil, false))
    {
        sw.Write(txt.Substring(1, eInd - 1));
    }
    txt = txt.Substring(eInd + 1);
    count++;
}
0 голосов
/ 13 января 2019

Спасибо, LocEngineer, программа работает, я немного изменил конкатонирование имени файла со счетчиком, используя «+» вместо «,».

using System.IO;
using System.Linq;


namespace ASCII_Split
{
    class Program
    {
        static void Main(string[] args)
        {
            var txt = "";
            const char soh = (char)1;
            const char eox = (char)3;
            var count = 1;
            var pathToFile = @"C:\Temp\00599060.txt";

            using (var sr = new StreamReader (pathToFile))
                txt = sr.ReadToEnd();

            if (txt.IndexOf(soh) != txt.LastIndexOf(soh))
            {


                while (txt.Contains(soh))
                {
                    var outfil = Path.Combine(Path.GetDirectoryName(pathToFile), count.ToString("00") + Path.GetFileName(pathToFile));
                    var eInd = txt.IndexOf(eox);
                    using (var sw = new StreamWriter(outfil, false))
                    {
                        sw.Write(txt.Substring(1, eInd - 1));
                    }
                    txt = txt.Substring(eInd + 1);
                    count++;
                }
                File.Move((pathToFile), (pathToFile) + ".org");
            }
        }
    }
}
0 голосов
/ 11 января 2019

Это должно более или менее сделать свое дело:


    //Read all text from file into a string
    var fileContent = File.ReadAllText("001234.txt");

    //split text into array according to a Regex pattern
    var pattern = @"SOH*ETX";
    var splitContent = Regex.Split(fileContent, pattern);

    //counter for file names
    var counter = 10;
    foreach(var content in splitContent)
    {
        //create file and use stream to write to it
        using (var stream = File.Create($"{counter++}1234.txt"))
        {
            var contentAsBytes = new UTF8Encoding(true).GetBytes(content);
            stream.Write(contentAsBytes, 0, contentAsBytes.Length);
        }
    }

...