Грамматики диапазона времени / даты - PullRequest
2 голосов
/ 05 февраля 2009

Мне нужно проанализировать строки, содержащие промежутки времени, такие как:

  • Четверг 6: 30-7: 30 AM
  • 30 декабря 2009 г. - 1 января 2010 г.
  • 1/15/09, с 7:30 до 20:30
  • четверг, с 6:30 до 7:30
  • и другие ...

добавлен

  • 6: 30 до 7: 30

и дата / время, такие как большинство случаев, когда Word может вставлять> date>

Поскольку я был бы крайне удивлен, если что-нибудь охватывает все случаи, которые мне нужно охватить, я ищу грамматику для начала.

1 Ответ

7 голосов
/ 05 февраля 2009

Хорошо, следующая грамматика разбирает что-либо в вашем примере:

DTExp        = Day, ['-', Day]
Day          = DayExp, [[','], ['from'], TimeRange]
DayExp       = WeekDay
             | [Weekday], Month, DayNumber, [[','], YearNumber]
             | [Weekday], MonthNumber, '/', DayNumber, ['/', YearNumber]
TimeRange    = Time, [['-'|'to'] Time]
Time         = HourNumber, ':', MinuteNumber, ['AM'|'PM']
WeekDay      = 'monday' | 'tuesday' | ...
Month        = MonthNumber | MonthName
MonthName    = 'january' | 'february' | ...
DayNumber    = Number
MonthNumber  = Number
YearNumber   = Number, ['AD'|'BC']
HourNumber   = Number
MinuteNumber = Number

В грамматике есть небольшая проблема. Если читается DayExp, за которым следуют Time и '-', то вы можете ожидать другого DayExp или другого времени. Но это решается с помощью предварительного просмотра, потому что, если это время, за числом следует знак «:».

Давайте попробуем построить дерево разбора:

Thursday  6    :  30     -   7    :   30    AM
    |     |        |         |         |     |
WeekDay Number : Number  - Number : Number   |
    |     -----|----         -----|----------- 
    |         Time       -       Time
    |           ---------|---------
 DayExp              TimeRange
    ----------|-----------
             Day
              |
            DTExp
...