Разбор даты RFC 822 с NSDateFormatter - PullRequest
16 голосов
/ 05 декабря 2009

Я использую NSDateFormatter для анализа даты RFC 822 на iPhone. Однако невозможно указать дополнительные элементы в формате даты. В спецификации RFC 822 есть несколько дополнительных частей, которые нарушают анализатор даты. Если ничего не получится, мне, вероятно, придется написать собственный синтаксический анализатор для соответствия спецификациям.

Например, название дня необязательно в спецификации. Итак, обе эти даты действительны:

Tue, 01 Dec 2009 08:48:25 +0000 анализируется в формате EEE, dd MMM yyyy HH:mm:ss z 01 Dec 2009 08:48:25 +0000 анализируется в формате dd MMM yyyy HH:mm:ss z

Это то, что я сейчас использую:

+ (NSDateFormatter *)rfc822Formatter {
    static NSDateFormatter *formatter = nil;
    if (formatter == nil) {
        formatter = [[NSDateFormatter alloc] init];
        NSLocale *enUS = [[NSLocale alloc] initWithLocaleIdentifier:@"en_US"];
        [formatter setLocale:enUS];
        [enUS release];
        [formatter setDateFormat:@"EEE, dd MMM yyyy HH:mm:ss z"];
    }
    return formatter;
}

+ (NSDate *)dateFromRFC822:(NSString *)date {
    NSDateFormatter *formatter = [NSDate rfc822Formatter];
    return [formatter dateFromString:date];
}

И разбирать дату следующим образом:

self.entry.published = [NSDate dateFromRFC822:self.currentString];

Один из способов - попробовать оба формата и принять все, что возвращает ненулевое значение Однако в спецификации есть две необязательные части (название дня и секунды), и будет 4 возможных комбинации. Все еще не так уж плохо, но немного хакерски.

Ответы [ 4 ]

6 голосов
/ 01 октября 2013

Я использовал следующий метод для анализа дат RFC822. Я полагаю, что он изначально был от MWFeedParser :

+ (NSDate *)dateFromRFC822String:(NSString *)dateString {

    // Create date formatter
    static NSDateFormatter *dateFormatter = nil;
    if (!dateFormatter) {
        NSLocale *en_US_POSIX = [[NSLocale alloc] initWithLocaleIdentifier:@"en_US_POSIX"];
        dateFormatter = [[NSDateFormatter alloc] init];
        [dateFormatter setLocale:en_US_POSIX];
        [dateFormatter setTimeZone:[NSTimeZone timeZoneForSecondsFromGMT:0]];
        [en_US_POSIX release];
    }

    // Process
    NSDate *date = nil;
    NSString *RFC822String = [[NSString stringWithString:dateString] uppercaseString];
    if ([RFC822String rangeOfString:@","].location != NSNotFound) {
        if (!date) { // Sun, 19 May 2002 15:21:36 GMT
            [dateFormatter setDateFormat:@"EEE, d MMM yyyy HH:mm:ss zzz"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // Sun, 19 May 2002 15:21 GMT
            [dateFormatter setDateFormat:@"EEE, d MMM yyyy HH:mm zzz"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // Sun, 19 May 2002 15:21:36
            [dateFormatter setDateFormat:@"EEE, d MMM yyyy HH:mm:ss"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // Sun, 19 May 2002 15:21
            [dateFormatter setDateFormat:@"EEE, d MMM yyyy HH:mm"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
    } else {
        if (!date) { // 19 May 2002 15:21:36 GMT
            [dateFormatter setDateFormat:@"d MMM yyyy HH:mm:ss zzz"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // 19 May 2002 15:21 GMT
            [dateFormatter setDateFormat:@"d MMM yyyy HH:mm zzz"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // 19 May 2002 15:21:36
            [dateFormatter setDateFormat:@"d MMM yyyy HH:mm:ss"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
        if (!date) { // 19 May 2002 15:21
            [dateFormatter setDateFormat:@"d MMM yyyy HH:mm"]; 
            date = [dateFormatter dateFromString:RFC822String];
        }
    }
    if (!date) NSLog(@"Could not parse RFC822 date: \"%@\" Possibly invalid format.", dateString);
    return date;

}
4 голосов
/ 05 декабря 2009

Подсчитайте количество значимых символов, прежде чем решить, какой форматер использовать. Например, два, которые вы даете, имеют разные числа запятых и пробелов Если ни один из известных форматов не соответствует количеству, значит, вы даже не пытались проанализировать его как дату.

1 голос
/ 05 декабря 2009

Я полагаю, что RFC 822 определяет два необязательных компонента в дате и времени: день недели и секунды после часа.

Как взломать, можно по символам на короткие дни недели:

NSArray *shortWeekSymbols = [NSArray arrayWithObjects:@"Sun,", @"Mon,", @"Tue,", @"Wed,", @"Thu,", @"Fri,", @"Sat,", nil];
        [formatter setShortWeekdaySymbols:shortWeekSymbols];

Если вы затем измените формат даты на этот: EEEdd MMM yyyy HH:mm:ss z. Вы сможете анализировать время без дня недели. Похоже, что после запятой тоже есть пробел.

Чтобы быть в безопасности, вы не должны просто слепо устанавливать символы, подобные этим. Вы должны использовать setShortWeekdaySymbols и перебирать их, добавляя запятую в конце. Причина в том, что они потенциально различны для каждой локали, и первый день может быть не воскресным.

Интересно, что формат EEE, dd MMM yyyy HH:mm:ss z будет анализировать время без дня недели, но там должна быть запятая, например , 01 Dec 2009 08:48:25 +0000. Таким образом, вы могли бы сделать что-то, как сказал Стив, но затем обрезать день и перейти к форматирующему. Отсутствие запятой в формате, по-видимому, не позволяет указывать неделю необязательно. Странно.

К сожалению, это по-прежнему не помогает с необязательным: ss в формате. Но это может позволить вам использовать два формата вместо четырех.

0 голосов
/ 20 апреля 2016

В случае, если это полезно для кого-то еще ... вот расширение NSDate + RFC822String.swift, основанное на ответе Симукала .

Он также кэширует последний использованный формат даты, который был успешным, поскольку установка dateFormatter.dateFormat стоит дорого.

import Foundation

private let dateFormatter: NSDateFormatter = {
    let dateFormatter = NSDateFormatter()
    dateFormatter.locale = NSLocale(localeIdentifier: "en_US_POSIX")
    dateFormatter.timeZone = NSTimeZone(forSecondsFromGMT: 0)

    return dateFormatter
}()

private let dateFormatsWithComma = ["EEE, d MMM yyyy HH:mm:ss zzz", "EEE, d MMM yyyy HH:mm zzz", "EEE, d MMM yyyy HH:mm:ss", "EEE, d MMM yyyy HH:mm"]
private let dateFormatsWithoutComma = ["d MMM yyyy HH:mm:ss zzz", "d MMM yyyy HH:mm zzz", "d MMM yyyy HH:mm:ss", "d MMM yyyy HH:mm"]

private var lastUsedDateFormatString: String?

extension NSDate {
    class func dateFromRFC822String(RFC822String: String) -> NSDate? {
        let RFC822String = RFC822String.uppercaseString

        if lastUsedDateFormatString != nil {
            if let date = dateFormatter.dateFromString(RFC822String) {
                return date
            }
        }

        if RFC822String.containsString(",") {
            for dateFormat in dateFormatsWithComma {
                dateFormatter.dateFormat = dateFormat
                if let date = dateFormatter.dateFromString(RFC822String) {
                    lastUsedDateFormatString = dateFormat
                    return date
                }
            }
        } else {
            for dateFormat in dateFormatsWithoutComma {
                dateFormatter.dateFormat = dateFormat
                if let date = dateFormatter.dateFromString(RFC822String) {
                    lastUsedDateFormatString = dateFormat
                    return date
                }
            }
        }

        return nil
    }
}
...