Существующий API для чтения дат из файлов SpreadsheetML? - PullRequest
2 голосов
/ 20 января 2011

Существует ли существующий API в Office Open XML SDK или сторонний разработчик для правильного считывания дат из файла SpreadsheetML / .xlsx?

Поскольку существует очень много переменных, которые влияют на обнаружение, когда значением является дата (numFmtId + пользовательские числовые форматы), а затем на преобразование серийного значения даты в значение DateTime (стандартные, обратно совместимые и 1904-супер-обратно совместимые книги ), кажется логичным, что это то, что SDK предоставит, или, по крайней мере, у кого-то будет существующий фрагмент кода для обработки.

Я использую C #, но решение для любого языка подойдет.

Ответы [ 2 ]

1 голос
/ 18 февраля 2011

Похоже, что там уже нет ничего конкретного для этой цели. Вот рутина, которую я придумал.

/// <summary>
/// Represents the formula used for converting date serial values stored within the workbook into DateTime instances.
/// </summary>
/// <remarks>
/// Information on date serial conversion is available here: http://www.documentinteropinitiative.com/implnotes/ISO-IEC29500-2008/001.018.017.004.001.000.000.aspx
/// </remarks>
public enum XlsxDateCompatibility
{
    /// <summary>
    /// Standard dates are based on December 30, 1899 and are considered "Standard 1900" dates.
    /// </summary>
    StandardBase1900,

    /// <summary>
    /// Excel for Windows backwards compatible dates are based on December 31, 1899 are are considered "Backwards compatible 1900" dates.
    /// </summary>
    BackwardsCompatibleBase1900,

    /// <summary>
    /// Excel for Macintos backwards compatible dates are based on January 1, 1904 and are considered "1904" dates.
    /// </summary>
    BackwardsCompatibleBase1904
}

    private static readonly IDictionary<XlsxDateCompatibility, DateTime> _dateSerialBaseDates
        = new Dictionary<XlsxDateCompatibility, DateTime>
            {
                {XlsxDateCompatibility.StandardBase1900, new DateTime(1899, 12, 30)},
                {XlsxDateCompatibility.BackwardsCompatibleBase1900, new DateTime(1899, 12, 31)},
                {XlsxDateCompatibility.BackwardsCompatibleBase1904, new DateTime(1904, 1, 1)}
            };

    public static DateTime DateSerialToDateTime(double dateSerial, XlsxDateCompatibility dateCompatibility)
    {

        // special case for dateCompaitility 1900, Excel thinks 1900 is a leap year
        // http://support.microsoft.com/kb/214019
        if (dateCompatibility == XlsxDateCompatibility.BackwardsCompatibleBase1900 && dateSerial >= 61.0)
        {
            dateSerial -= 1;
        }

        DateTime baseDate;          
        if (!_dateSerialBaseDates.TryGetValue(dateCompatibility, out baseDate))
        {
            baseDate = _dateSerialBaseDates[XlsxDateCompatibility.StandardBase1900];
        }
        return baseDate.AddDays(dateSerial);
    }
0 голосов
/ 20 января 2011

Я никогда не читал Date раньше, но я думаю, вам нужно сравнить индекс стиля в ячейке, которую вы читаете, с индексом стиля даты в элементе x:numFmts, который вы найдете в x:cellStyle.Я знаю, что в Office 2010 есть индикатор типа данных даты в ячейке, где <x:c t='d'>, поэтому, если вы используете эту версию, было бы намного легче найти, являются ли данные датой или нет.Вот как это будет выглядеть в Office 2010:

<x:c r="C4" t="d"> 
   <x:v>1976-11-22T08:30Z</x:v>
</x:c> 

Чтобы преобразовать данные в DateTime, я считаю, что все, что вам нужно сделать, - это DateTime.FromOADate(cellvalue), где cellValue - двойное число.Я знаю, что мы конвертируем DateTime в OADate перед вставкой дат в наши документы Excel, поэтому я думаю, что использование метода FromOADate будет работать нормально.

Что касается API, выполняющего эти функции, я не знаюлюбой, который будет выполнять то, что вы хотите, но я бы хотел, чтобы он был включен в будущие версии SDK.

...