Чистое тело письма / текст для анализа настроений в R - PullRequest
0 голосов
/ 25 октября 2019

Мы работаем над анализом настроений в электронных письмах. Перед началом нашего анализа нам нужно очистить данные, чтобы удалить данные отправителя / получателя, подпись и другие нежелательные тексты.

Мы читаем данные из таблицы SQL, и один из столбцов - это текст электронной почты.

Например, текст электронного письма выглядит следующим образом:

email = "From: x@y.org \ nTo: z.referral@z1.caqh.org \ nCC: mari.o.herrera@x. com \ nSubject: RE: строка темы \ n --- \ n EMAIL BODY ?? \ n \ n ПОДПИСЬ С АДРЕСОМ ОФИСА, n \ n \ nПриложение вложений2: \ nВложение электронной почты3: \ nВложение электронной почты: \ n \ n -------------------------------- \ n \ nЭто сообщение предназначено только для назначенного получателя и может содержать привилегированное, частное или иное частноеинформация. Если вы получили ее по ошибке, немедленно уведомите отправителя и удалите оригинал. Любое другое использование вами электронной почты запрещено. \ n "

Мы хотим удалить все и сохранить только" Электронная почтаТело "для нашего анализа

У нас есть какой-нибудь пакет / функция в R для достижения этого?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...