Как мне прочитать файл Excel в C #, не пропуская ни одного столбца? - PullRequest
5 голосов
/ 20 февраля 2009

Я давно пользуюсь подключением OleDb для успешного чтения файлов Excel, но столкнулся с проблемой. У меня есть кто-то, кто пытается загрузить электронную таблицу Excel, но в первом столбце ничего нет, и когда я пытаюсь прочитать файл, он не распознает этот столбец.

В настоящее время я использую следующую строку подключения OleDb:

Provider = Microsoft.Jet.OLEDB.4.0;
Источник данных = c: \ test.xls;
Расширенные свойства = "Excel 8.0; IMEX = 1;"

Итак, если в файле Excel 13 столбцов, то OleDbDataReader, который я получаю, имеет только 12 столбцов / полей.

Любое понимание будет оценено.

Ответы [ 6 ]

3 голосов
/ 20 февраля 2009

SpreadsheetGear for .NET предоставляет API для работы с книгами xls и xlsx из .NET. Он проще в использовании и быстрее, чем OleDB или объектная модель Excel COM. Вы можете посмотреть живые образцы или попробовать сами с бесплатной пробной версией .

Отказ от ответственности: я владею SpreadsheetGear LLC

РЕДАКТИРОВАТЬ:

StingyJack прокомментировал: « Быстрее, чем OleDb? Лучше вернуть эту заявку на ».

Это разумный запрос. Я все время вижу утверждения, которые, как я знаю, по факту являются ложными, поэтому я не могу никого обвинять в скептицизме.

Ниже приведен код для создания книги размером 50 000 строк на 10 столбцов с помощью SpreadsheetGear, сохранения ее на диске и суммирования чисел с помощью OleDb и SpreadsheetGear. SpreadsheetGear считывает 500К ячеек за 0,31 секунды по сравнению с 0,63 секунды с OleDB - чуть более чем в два раза быстрее. SpreadsheetGear фактически создает и читает книгу за меньшее время, чем требуется для чтения книги с помощью OleDB.

Код ниже. Вы можете попробовать сами с помощью бесплатной пробной версии SpreadsheetGear.

using System;
using System.Data; 
using System.Data.OleDb; 
using SpreadsheetGear;
using SpreadsheetGear.Advanced.Cells;
using System.Diagnostics;

namespace SpreadsheetGearAndOleDBBenchmark
{
    class Program
    {
        static void Main(string[] args)
        {
            // Warm up (get the code JITed).
            BM(10, 10);

            // Do it for real.
            BM(50000, 10);
        }

        static void BM(int rows, int cols)
        {
            // Compare the performance of OleDB to SpreadsheetGear for reading
            // workbooks. We sum numbers just to have something to do.
            //
            // Run on Windows Vista 32 bit, Visual Studio 2008, Release Build,
            // Run Without Debugger:
            //  Create time: 0.25 seconds
            //  OleDb Time: 0.63 seconds
            //  SpreadsheetGear Time: 0.31 seconds
            //
            // SpreadsheetGear is more than twice as fast at reading. Furthermore,
            // SpreadsheetGear can create the file and read it faster than OleDB
            // can just read it.
            string filename = @"C:\tmp\SpreadsheetGearOleDbBenchmark.xls";
            Console.WriteLine("\nCreating {0} rows x {1} columns", rows, cols);
            Stopwatch timer = Stopwatch.StartNew();
            double createSum = CreateWorkbook(filename, rows, cols);
            double createTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("Create sum of {0} took {1} seconds.", createSum, createTime);
            timer = Stopwatch.StartNew();
            double oleDbSum = ReadWithOleDB(filename);
            double oleDbTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("OleDb sum of {0} took {1} seconds.", oleDbSum, oleDbTime);
            timer = Stopwatch.StartNew();
            double spreadsheetGearSum = ReadWithSpreadsheetGear(filename);
            double spreadsheetGearTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("SpreadsheetGear sum of {0} took {1} seconds.", spreadsheetGearSum, spreadsheetGearTime);
        }

        static double CreateWorkbook(string filename, int rows, int cols)
        {
            IWorkbook workbook = Factory.GetWorkbook();
            IWorksheet worksheet = workbook.Worksheets[0];
            IValues values = (IValues)worksheet;
            double sum = 0.0;
            Random rand = new Random();
            // Put labels in the first row.
            foreach (IRange cell in worksheet.Cells[0, 0, 0, cols - 1])
                cell.Value = "Cell-" + cell.Address;
            // Using IRange and foreach be less code, 
            // but we'll do it the fast way.
            for (int row = 1; row <= rows; row++)
            {
                for (int col = 0; col < cols; col++)
                {
                    double number = rand.NextDouble();
                    sum += number;
                    values.SetNumber(row, col, number);
                }
            }
            workbook.SaveAs(filename, FileFormat.Excel8);
            return sum;
        }

        static double ReadWithSpreadsheetGear(string filename)
        {
            IWorkbook workbook = Factory.GetWorkbook(filename);
            IWorksheet worksheet = workbook.Worksheets[0];
            IValues values = (IValues)worksheet;
            IRange usedRahge = worksheet.UsedRange;
            int rowCount = usedRahge.RowCount;
            int colCount = usedRahge.ColumnCount;
            double sum = 0.0;
            // We could use foreach (IRange cell in usedRange) for cleaner 
            // code, but this is faster.
            for (int row = 1; row <= rowCount; row++)
            {
                for (int col = 0; col < colCount; col++)
                {
                    IValue value = values[row, col];
                    if (value != null && value.Type == SpreadsheetGear.Advanced.Cells.ValueType.Number)
                        sum += value.Number;
                }
            }
            return sum;
        }

        static double ReadWithOleDB(string filename)
        {
            String connectionString =  
                "Provider=Microsoft.Jet.OLEDB.4.0;" + 
                "Data Source=" + filename + ";" + 
                "Extended Properties=Excel 8.0;"; 
            OleDbConnection connection = new OleDbConnection(connectionString); 
            connection.Open(); 
            OleDbCommand selectCommand =new OleDbCommand("SELECT * FROM [Sheet1$]", connection); 
            OleDbDataAdapter dataAdapter = new OleDbDataAdapter(); 
            dataAdapter.SelectCommand = selectCommand; 
            DataSet dataSet = new DataSet(); 
            dataAdapter.Fill(dataSet); 
            connection.Close(); 
            double sum = 0.0;
            // We'll make some assumptions for brevity of the code.
            DataTable dataTable = dataSet.Tables[0];
            int cols = dataTable.Columns.Count;
            foreach (DataRow row in dataTable.Rows)
            {
                for (int i = 0; i < cols; i++)
                {
                    object val = row[i];
                    if (val is double)
                        sum += (double)val;
                }
            }
            return sum;
        }
    }
}
1 голос
/ 22 мая 2009

Вы, вероятно, можете посмотреть на ExcelMapper. Это инструмент для чтения файлов Excel как строго типизированных объектов. Он скрывает все детали чтения Excel из вашего кода. Он позаботится о том, чтобы в вашем Excel отсутствовал столбец или в столбце отсутствовали данные. Вы читаете данные, которые вас интересуют. Вы можете получить код / ​​исполняемый файл для ExcelMapper с http://code.google.com/p/excelmapper/.

1 голос
/ 20 февраля 2009

Мы всегда используем Excel Interop для открытия электронной таблицы и непосредственного анализа (например, аналогично тому, как вы сканируете ячейки в VBA), или мы создаем закрытые шаблоны, которые предписывают заполнение определенных столбцов, прежде чем пользователь сможет сохранить данные .

0 голосов
/ 21 февраля 2009

Я рекомендую вам попробовать Visual Studio Tools для Office и Excel Interop! Использовать его очень просто.

0 голосов
/ 20 февраля 2009

Вы можете попробовать использовать Excel и COM. Таким образом, вы будете получать информацию прямо изо рта лошади.

От Д. Ананда на форумах MSDN:

Создайте в своем проекте ссылку на библиотеку объектов Excel. Библиотека объектов Excel может быть добавлена ​​на вкладке COM диалогового окна добавления ссылок.

Вот некоторая информация об объектной модели Excel в C # http://msdn.microsoft.com/en-us/library/aa168292(office.11).aspx

0 голосов
/ 20 февраля 2009

Если бы для формата листа Excel требовались заголовки столбцов, то у вас всегда было бы 13 столбцов. Вам просто нужно пропустить строку заголовка при обработке.

Это также исправит ситуации, когда пользователь размещает столбцы в порядке, который вы не ожидаете. (определить индексы столбцов в строке заголовка и прочитать их правильно)

Я вижу, что другие рекомендуют взаимодействие с Excel, но, боже, это медленный вариант по сравнению с способом OleDb. Кроме того, для установки на сервере требуется Excel или OWC (лицензирование).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...