Относительная дата признания юридического лица - PullRequest
0 голосов
/ 29 января 2020

Я использую spaCy в качестве библиотеки NLP для обнаружения именованных объектов. Я хочу извлечь даты и время из текста автоматически. Например, запишите дату в этом предложении: I will go to the show on 1/1/2020 и определите, что 1/1/2020 является именованным объектом DATE.

Но я также хочу понять относительные фразы времени, например I will go to the show tomorrow. tomorrow определяется как именованный объект DATE, но я не знаю, к какому времени оно относится - если сегодня 1/1/2020, то завтра 1/2/2020. Я хочу получить 1/2/2020 непосредственно от именованной сущности, даже если она относительная.

Я попытался сделать это вручную, создав словарь, но именованные сущности даты очень широки, и мне не хватает их с stati c dictionary.

Есть ли способ получить фактическое время от относительной даты, названной сущностью?

1 Ответ

0 голосов
/ 30 января 2020

Вы можете попробовать библиотеку dateparser. Ссылка на документы

pip install dateparser

Пример:

from dateparser import parse
from dateparser.search import search_dates

print(parse('Tomorrow'))
print(parse('01/01/20'))
print(search_dates("I will go to the show tomorrow"))
print(search_dates("The client arrived to the office for the first time in March 3rd, 2004 and got serviced, after a couple of months, on May 6th 2004, the customer returned indicating a defect on the part"))

вывод :

2020-01-30 21:03:17.551187
2020-01-01 00:00:00
[('tomorrow', datetime.datetime(2020, 1, 30, 21, 6, 19, 545368))]
[('in March 3rd, 2004 and', datetime.datetime(2004, 3, 3, 0, 0)), 
 ('on May 6th 2004', datetime.datetime(2004, 5, 6, 0, 0))]
...