НЛП подходит для определения даты / времени в тексте - PullRequest
0 голосов
/ 18 марта 2019

Мне нужно разработать приложение, которое идентифицирует дату внутри данного текста, используя некоторый подход НЛП. Давайте предположим, что у меня есть данные в БД со столбцом дат «от», «до» и, если текст ниже,

Get data between 1st August and 15th August

Мне нужно определить даты и сформировать запрос для получения данных. Я использовал Natty NLP и смог определить даты. Но я застрял для более сложных выражений времени, таких как:

Get data uploaded next week
Get data uploaded last week

Здесь для первого мне нужно определить дату понедельника на следующей неделе и дату воскресенья и сформировать запрос для второго. Но с Нетти это дает мне на следующей неделе с сегодняшнего дня Какие еще решения существуют? Или мне нужно манипулировать выражением путем кодирования? Я использую Java.

Заранее спасибо.

1 Ответ

1 голос
/ 18 марта 2019

Ваши вопросы немного сбивают с толку, но я думаю, вы хотите достичь двух вещей:

  1. Определите слова, которые представляют выражение времени

  2. Сопоставьте эти слова с формальным машиночитаемым представлением

Если это то, что вам нужно, проверьте структуру утенка , она идентифицирует выражения времени и нормализует их водно уникальное формальное представление даты.Обратите внимание, что вам нужно передать контрольную дату для неоднозначных выражений времени.

Вы можете запустить ее как службу и вызвать ее из своего кода.

...