Я хочу идентифицировать и извлекать дату из ряда различных строк. Даты могут иметь другой формат. Я использовал пакет datefinder, но у меня возникли проблемы с сохранением вывода.
Цель: извлечь дату из строки, которая может быть отформатирована различными способами (ie 22 апреля или 22 апреля или 22 апреля и т. Д. c), и если нет date, установите значение «Нет» и добавьте к списку дат либо дату, либо «Нет».
См. примеры ниже.
Пример 1: (Это возвращает дату, но не добавляется в мой список)
import datefinder
extracted_dates = []
sample_text = 'As of February 27, 2019 there were 28 dogs at the kennel.'
matches = datefinder.find_dates(sample_text)
for match in matches:
if match == None:
date = 'None'
extracted_dates.append(date)
else:
date = str(match)
extracted_dates.append(date)
Пример 2: (Это не возвращает дату и не добавляется в мой список)
import datefinder
extracted_dates = []
sample_text = 'As of the date, there were 28 dogs at the kennel.'
matches = datefinder.find_dates(sample_text)
for match in matches:
if match == None:
date = 'None'
extracted_dates.append(date)
else:
date = str(match)
extracted_dates.append(date)