Удалить первые N строк в символьном столбце во фрейме данных - PullRequest
0 голосов
/ 22 ноября 2018

У меня есть фрейм данных, содержащий электронные письма.Существует столбец с именем «message», который выглядит следующим образом:

> > dataset$message[1]  
>[1] Message-ID:...
> 
> Date: ...
> 
> From: ...
> 
> To:...
> 
> Subject: ...
> 
> Mime-Version: ...
> 
> Content-Type:...
> 
> Content-Transfer-Encoding: ...
> 
> X-From:...
> 
> X-To: ...
> 
> X-cc:...
> 
> X-bcc: ...
> 
> X-Folder: ...
> 
> X-Origin: ...
> 
> X-FileName: ...
>  
> > Some message text

Другими словами, каждая запись содержит 15 строк заголовков, а затем текст.Я хочу удалить эти 15 строк из каждой строки и оставить только текст, чтобы

>dataset$message[1]

выглядело так:

> Some message text

1 Ответ

0 голосов
/ 22 ноября 2018

Примерно так будет работать:

sub("^(?:.*\\n){15}", "", multiline_string_mail, perl = TRUE)

#[1] "Super secret message"

пример данных: (вы всегда должны предоставлять пригодные примеры данных)

multiline_string_mail =
"hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
Super secret message"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...