Разбор текстовой строки для дат - не стандартная проблема преобразования! - PullRequest
2 голосов
/ 21 января 2010

Кто-нибудь знает библиотеку - в идеале, Python, которая может иметь удар при извлечении дат из текста?

«Пойдем сегодня в библиотеку» -> 21 января 10 «Начало 1 января» -> 1 января 10 «В любое время с 3 по 5 февраля 2009 г.» -> 3 февраля 09, 5 февраля 09

Это сложная проблема и, вероятно, почему я ничего не нашел! Кстати, уже пользуюсь NLTK, если это поможет.

Ответы [ 3 ]

4 голосов
/ 21 января 2010

Похоже, этот модуль - то, что вы ищете: parsedatetime

2 голосов
/ 26 января 2010

На сайте PyParsing имеется небольшой бонусный скрипт для выражений времени анализа . Я бы сказал, что стоит посмотреть на вас!

Редактировать: Я вижу, что вы уже оказались там, когда я набирал свое предложение. Удачи тебе!

1 голос
/ 26 января 2010

Спасибо за вклад - в конце я последовал за одним из комментариев, который привел к разборке, что привело к началу решения. большое спасибо всем.

Опубликуйте незавершенную работу, два фрагмента кода здесь http://pbjots.blogspot.com/2010/01/using-pyparsing-to-extract-dates-from.html на случай, если они кому-нибудь помогут.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...