Я хочу извлечь даты, указанные в текстовой форме, например 'next week'
или 'February'
, из новостной статьи, учитывая дату публикации статьи.Т.е., если статья была опубликована 13 февраля 2019 г., а в этой статье упоминалось 'next week'
, я хочу, чтобы функция нашла 20 февраля 2019 г. для 'next week'
.Кто-нибудь знает, как это сделать?Я думал о том, чтобы сделать это с помощью средства поиска сущностей spaCy, а затем вручную написать функцию для каждого экземпляра 'DATE', но должно быть что-то лучше.
Вот мой пример:
text = """Chancellor Angela Merkel and some of her ministers will
discuss at a cabinet retreat next week ways to avert driving
bans in major cities after Germany's top administrative court
in February allowed local authorities to bar heavily polluting
diesel cars."""
article_date = '2019-02-13'
Мой идеальный результат будет выглядеть следующим образом:
ref_dates = {'next_week': '2019-02-20',
'february': '2019-02-01'}