У меня есть тексты, которые обычно начинаются с:
“12 minutes ago - There was a meeting...”
“2 hours ago - Apologies for being...”
“1 day ago - It is a sunny day in London...”
и так далее. В основном у меня есть информация о:
Minutes
Hours
Day (starting from today)
Я хотел бы преобразовать эту информацию в ценную информацию времени ser ie, чтобы извлечь эту часть и создать новый столбец из этого (Datetime). В моем наборе данных есть один столбец (Дата), где у меня уже есть дата, когда было проведено исследование (например, сегодня), в этом формате: 26/05/2020 и когда был отправлен поиск (например, 8:41. ). Поэтому, если текст начинается с «12 минут назад», у меня должно быть:
26/05/2020 - 8:29 (datetime format in Python)
А для других:
26/05/2020 - 6:41
25/05/2020 - 8:41
Важно, чтобы что-то было (строка, числа c, формат даты), который я могу построить как временной ряд (я хотел бы увидеть, сколько текстов было опубликовано с точки зрения временного интервала). Есть идеи, как я могу это сделать?