Удаление кавычек в файловых помощниках - PullRequest
1 голос
/ 03 февраля 2012

У меня есть файл .csv (я не контролирую данные), и по какой-то причине он содержит все в кавычках.

"Date","Description","Original Description","Amount","Type","Category","Name","Labels","Notes"
"2/02/2012","ac","ac","515.00","a","b","","javascript://"
"2/02/2012","test","test","40.00","a","d","c",""," "

Я использую filehelpers , и мне интересно, каким будет лучший способ удалить все эти цитаты? Есть ли что-то, что говорит "если я увижу цитаты удаляются. Если не найдено ни одной цитаты, ничего не делай"?

Это портит данные, так как у меня будет "\"515.00\"" с ненужными лишними кавычками (тем более, что в этом случае я хочу, чтобы это был десятичный знак, а не строка ".

Я также не уверен, что такое "javascript" и зачем он был создан, но это служба, которую я не могу контролировать.

редактировать Вот как я использую файл CSV.

    using (TextReader textReader = new StreamReader(stream))
        {
            engine.ErrorManager.ErrorMode = ErrorMode.SaveAndContinue; 

            object[] transactions = engine.ReadStream(textReader);
        }

Ответы [ 4 ]

9 голосов
/ 06 февраля 2012

Вы можете использовать атрибут FieldQuoted, который лучше всего описан на странице атрибутов здесь .Обратите внимание, что атрибут может быть применен к любому полю FileHelpers (даже если он напечатан Decimal).(Помните, что класс FileHelpers описывает спецификацию для вашего файла импорта. Поэтому, когда вы помечаете поле Decimal как FieldQuoted, вы говорите в файле, это поле будет заключено в кавычки. )

Вы даже можете указать, являются ли кавычки необязательными с

[FieldQuoted('"', QuoteMode.OptionalForBoth)] 

Вот консольное приложение, которое работает с вашими данными:

class Program
{
    [DelimitedRecord(",")]
    [IgnoreFirst(1)]
    public class Format1
    {
        [FieldQuoted]
        [FieldConverter(ConverterKind.Date, "d/M/yyyy")]
        public DateTime Date;
        [FieldQuoted]
        public string Description;
        [FieldQuoted]
        public string OriginalDescription;
        [FieldQuoted]
        public Decimal Amount;
        [FieldQuoted]
        public string Type;
        [FieldQuoted]
        public string Category;
        [FieldQuoted]
        public string Name;
        [FieldQuoted]
        public string Labels;
        [FieldQuoted]
        [FieldOptional]
        public string Notes;
    }

    static void Main(string[] args)
    {
        var engine = new FileHelperEngine(typeof(Format1));

        // read in the data   
        object[] importedObjects = engine.ReadString(@"""Date"",""Description"",""Original Description"",""Amount"",""Type"",""Category"",""Name"",""Labels"",""Notes""
""2/02/2012"",""ac"",""ac"",""515.00"",""a"",""b"","""",""javascript://""
""2/02/2012"",""test"",""test"",""40.00"",""a"",""d"",""c"","""","" """);

        // check that 2 records were imported
        Assert.AreEqual(2, importedObjects.Length);

        // check the values for the first record
        Format1 customer1 = (Format1)importedObjects[0];
        Assert.AreEqual(DateTime.Parse("2/02/2012"), customer1.Date);
        Assert.AreEqual("ac", customer1.Description);
        Assert.AreEqual("ac", customer1.OriginalDescription);
        Assert.AreEqual(515.00, customer1.Amount);
        Assert.AreEqual("a", customer1.Type);
        Assert.AreEqual("b", customer1.Category);
        Assert.AreEqual("", customer1.Name);
        Assert.AreEqual("javascript://", customer1.Labels);
        Assert.AreEqual("", customer1.Notes);

        // check the values for the second record
        Format1 customer2 = (Format1)importedObjects[1];
        Assert.AreEqual(DateTime.Parse("2/02/2012"), customer2.Date);
        Assert.AreEqual("test", customer2.Description);
        Assert.AreEqual("test", customer2.OriginalDescription);
        Assert.AreEqual(40.00, customer2.Amount);
        Assert.AreEqual("a", customer2.Type);
        Assert.AreEqual("d", customer2.Category);
        Assert.AreEqual("c", customer2.Name);
        Assert.AreEqual("", customer2.Labels);
        Assert.AreEqual(" ", customer2.Notes);
    }
}

(Обратите внимание, чтоВ первой строке данных вместо 8 полей указано 8, поэтому я пометил поле Notes FieldOptional).

0 голосов
/ 30 октября 2013

Этот код может помочь, который я разработал:

using (StreamReader r = new StreamReader("C:\\Projects\\Mactive\\Audience\\DrawBalancing\\CSVFiles\\Analytix_ABC_HD.csv"))
{
     string row;

     int outCount;
         StringBuilder line=new StringBuilder() ;
         string token="";
         char chr;
         string Eachline;

     while ((row = r.ReadLine()) != null)
     {
         outCount = row.Length;
         line = new StringBuilder();
         for (int innerCount = 0; innerCount <= outCount - 1; innerCount++)
         {                   
             chr=row[innerCount];

             if (chr != '"')
             {
                 line.Append(row[innerCount].ToString());
             }
             else if(chr=='"')
             {
                 token = "";
                 innerCount = innerCount + 1;
                 for (; innerCount < outCount - 1; innerCount++)
                 {
                     chr=row[innerCount];
                     if(chr=='"')
                     {
                         break;
                     }

                     token = token + chr.ToString();                               
                 }

                 if(token.Contains(",")){token=token.Replace(",","");}
                 line.Append(token);
             }                 
         }
         Eachline = line.ToString();
         Console.WriteLine(Eachline);
    }
}
0 голосов
/ 04 февраля 2012

У меня такое же затруднительное положение, и я заменяю кавычки, когда загружаю значение в мой объект списка:

using System;
using System.Collections.Generic;
using System.IO;
using System.Windows.Forms;

namespace WindowsFormsApplication6
{
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }

        private void Form1_Load(object sender, EventArgs e)
        {
            LoadCSV();
        }

        private void LoadCSV()
        {
            List<string> Rows = new List<string>();
            string m_CSVFilePath = "<Path to CSV File>";

            using (StreamReader r = new StreamReader(m_CSVFilePath))
            {
                string row;

                while ((row = r.ReadLine()) != null)
                {
                    Rows.Add(row.Replace("\"", ""));
                }

                foreach (var Row in Rows)
                {
                    if (Row.Length > 0)
                    {
                        string[] RowValue = Row.Split(',');

                        //Do something with values here
                    }
                }
            }
        }

    }
}
0 голосов
/ 03 февраля 2012

Вот один из способов сделать это:

string[] lines = new string[]
{
    "\"Date\",\"Description\",\"Original Description\",\"Amount\",\"Type\",\"Category\",\"Name\",\"Labels\",\"Notes\"",
    "\"2/02/2012\",\"ac\",\"ac\",\"515.00\",\"a\",\"b\",\"\",\"javascript://\"",
    "\"2/02/2012\",\"test\",\"test\",\"40.00\",\"a\",\"d\",\"c\",\"\",\" \"",
};

string[][] values =
    lines.Select(line =>
        line.Trim('"')
            .Split(new string[] { "\",\"" }, StringSplitOptions.None)
            .ToArray()
        ).ToArray();

Массив lines представляет строки в вашем образце.Каждый символ " должен быть экранирован как \" в строковых литералах C #.

Для каждой строки мы начинаем с удаления первого и последнего " символов, а затем продолжаем разбивать его на коллекциюподстроки, использующие последовательность символов "," в качестве разделителя.

Обратите внимание, что приведенный выше код будет не работать , если у вас есть " символы, встречающиеся в ваших значениях (даже если экранированы).

Редактировать : если ваш CSV должен читаться из потока, все, что вам нужно сделать, это:

var lines = new List<string>();
using (var streamReader = new StreamReader(stream))
    while (!streamReader.EndOfStream)
        lines.Add(streamReader.ReadLine());

Остальная часть приведенного выше кода будет работатьбез изменений.

Редактировать : Учитывая ваш новый код, проверьте, ищете ли вы что-то вроде этого:

for (int i = 0; i < transactions.Length; ++i)
{
    object oTrans = transactions[i]; 
    string sTrans = oTrans as string;
    if (sTrans != null && 
        sTrans.StartsWith("\"") &&
        sTrans.EndsWith("\""))
    {
        transactions[i] = sTrans.Substring(1, sTrans.Length - 2);
    }
}
...