Мы работаем над анализом настроений в электронных письмах. Перед началом нашего анализа нам нужно очистить данные, чтобы удалить данные отправителя / получателя, подпись и другие нежелательные тексты.
Мы читаем данные из таблицы SQL, и один из столбцов - это текст электронной почты.
Например, текст электронного письма выглядит следующим образом:
email = "From: x@y.org \ nTo: z.referral@z1.caqh.org \ nCC: mari.o.herrera@x. com \ nSubject: RE: строка темы \ n --- \ n EMAIL BODY ?? \ n \ n ПОДПИСЬ С АДРЕСОМ ОФИСА, n \ n \ nПриложение вложений2: \ nВложение электронной почты3: \ nВложение электронной почты: \ n \ n -------------------------------- \ n \ nЭто сообщение предназначено только для назначенного получателя и может содержать привилегированное, частное или иное частноеинформация. Если вы получили ее по ошибке, немедленно уведомите отправителя и удалите оригинал. Любое другое использование вами электронной почты запрещено. \ n "
Мы хотим удалить все и сохранить только" Электронная почтаТело "для нашего анализа
У нас есть какой-нибудь пакет / функция в R для достижения этого?