Я использую оболочку Python из SLPime НЛП Стэнфорда.Сравнивая результаты с другими анализаторами дат, такими как утенок, date_arser search_dates, parsedatetime и natty, SUTime дает наиболее надежные результаты.
Однако не удается зафиксировать некоторые очевидные даты из документов.Ниже приведены 2 типа документов, которые у меня возникают с трудностями при разборе дат с использованием SUTime.
- Я вышел, и я не буду доступен до 9/19
- Я вышел, и я не буду доступен в период с (18 сентября по 20 сентября)
Не дает результатов в случае первого документа.Однако для второго документа он фиксирует только месяц, но не диапазон дат или дат.
Я попытался обернуть голову вокруг кода Java, чтобы посмотреть, смогу ли я изменить или добавить некоторые правила, чтобы сделать эту работу, но не смог понять.
Если кто-то может предложить способчтобы сделать эту работу с SUTime, было бы очень полезно.
Кроме того, я попытался использовать search_dates для dateparser, и он ненадежен, так как захватывает все и вся.Как и в случае с первым документом, он будет анализировать дату в тексте "я ушел" (который не требуется) и "9/19" (что нормально).Так что, если есть способ контролировать это поведение, оно также будет работать.