У меня есть скрипт, который берет загруженный пользователем RTF-документ и объединяет некоторые личные данные в букву (имя, адрес и т. Д.) И делает это для нескольких людей. Я объединяю содержимое письма, а затем объединяю его с содержимым следующего письма слияния для всех записей о людях.
Аффективно я объединяю один RTF-документ в себя для того количества людей, с которыми мне нужно объединить письмо. Тем не менее, мне нужно сначала удалить закрывающую разметку RTF и открытие разметки RTF каждого слияния, иначе RTF не будет отображаться правильно. Это звучит как работа для регулярных выражений.
По сути, мне нужно регулярное выражение, которое удалит всю строку:
} \ n \ page НИЧЕГО \ par
Например, это регулярное выражение будет соответствовать этому:
crap
}
\page{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fswiss\fcharset0 Arial;}}
{\*\generator Msftedit 5.41.15.1515;}\viewkind4\uc1\pard\f0\fs20 September 30, 2008\par
more crap
Так что я мог бы сделать это просто:
crap
\page
more crap
RegEx - лучший подход здесь?
ОБНОВЛЕНИЕ: Почему я должен использовать RTF?
Я хочу разрешить пользователю загружать письмо формы, которое система затем будет использовать для создания объединенных писем. Поскольку RTF - простой текст, я могу сделать это довольно легко в коде. Я знаю, RTF - это катастрофа спецификации, но я не знаю другой хорошей альтернативы.