Извлечь даты в любом формате из текста в R - PullRequest
0 голосов
/ 03 мая 2018

Я хочу извлечь даты из данного текста, даты могут быть в любом формате 10 апреля 2018, 10-04-2018, 10/04/2018, 2018/04/10, 04.10.2018 как в других форматах ....

У меня есть новостные данные, и я хочу извлечь даты из текста

например: Мой друг приедет 10 июля 2018 или 10/07/2018

я хочу извлечь дату из заданного текста

Пожалуйста, помогите

Заранее спасибо

1 Ответ

0 голосов
/ 03 мая 2018

мы извлекаем его используя str_extract, а затем anydate получаем формат

library(anytime)
library(stringr)
anydate(str_extract_all(str1, "[[:alnum:]]+[ /]*\\d{2}[ /]*\\d{4}")[[1]])
#[1] "2018-07-10" "2018-10-07"

данные

str1 <- "My Friend is coming on july 10 2018 or 10/07/2018"
...