У меня есть большой XML-файл, который я редактирую с помощью BBEdit.
В XML-файле, который представляет собой цифровое воссоздание старого дневника, есть текст, заключенный в теги заметок.
<note>Example of a note.</note>
Однако некоторые теги заметок содержат кавычки, вложенные в вложенные теги цитат.
<note>Example of a note, but <quote>"here is a quotation within the note"</quote></note>
Мне нужно удалить все экземпляры цитаты из тегов заметки, сохранив фактическое содержание тегов цитаты. Таким образом, пример будет:
<note>Example of a note, but "here is a quotation within the note"</note>
Я использовал GREP в BBEdit для успешного удаления некоторых из них, но я начинаю зацикливаться на более сложных тегах заметок, которые идут по нескольким строкам или имеют текст между двумя различными наборами тегов. Например:
<note>Example of a note, <quote>"with a quotation"</quote> and a <quote>"second quotation"</quote> along with some text outside of the quotation before the end of the note.</note>
Некоторые цитаты могут продолжаться более 10 строк. Использование \ r в моем регулярном выражении, похоже, не помогает.
Я должен также сказать, что теги кавычек могут существовать вне тегов заметок, что исключает возможность просто массового поиска /? Цитаты и удаления ее. Мне все еще нужно использовать теги цитат в документе, но не внутри тегов заметок.
Большое спасибо за любую помощь.