Извлечение дат из текста с помощью spaCy в отношении определенной даты - PullRequest
0 голосов
/ 22 февраля 2019

Я хочу извлечь даты, указанные в текстовой форме, например 'next week' или 'February', из новостной статьи, учитывая дату публикации статьи.Т.е., если статья была опубликована 13 февраля 2019 г., а в этой статье упоминалось 'next week', я хочу, чтобы функция нашла 20 февраля 2019 г. для 'next week'.Кто-нибудь знает, как это сделать?Я думал о том, чтобы сделать это с помощью средства поиска сущностей spaCy, а затем вручную написать функцию для каждого экземпляра 'DATE', но должно быть что-то лучше.

Вот мой пример:

text = """Chancellor Angela Merkel and some of her ministers will
          discuss at a cabinet retreat next week ways to avert driving
          bans in major cities after Germany's top administrative court
          in February allowed local authorities to bar heavily polluting
          diesel cars."""
article_date = '2019-02-13'

Мой идеальный результат будет выглядеть следующим образом:

 ref_dates = {'next_week': '2019-02-20',
              'february': '2019-02-01'}

1 Ответ

0 голосов
/ 22 февраля 2019

С помощью SUTime от CoreNLP это можно сделать довольно легко: https://github.com/FraBle/python-sutime

...