Как удалить весь контент за пределами XML в файле - PullRequest
0 голосов
/ 10 мая 2019

Я ищу команду для сохранения только XML в файле, но я не знаю, как это сделать.

Я искал регулярное выражение, я нашел это регулярное выражение для поиска своего содержимого.(<msg>[\s\S]*?<\/msg>)

Но я не говорю, как интегрировать в sed для создания этой команды в моей программе: sed regex> myfile.Или лучше удалить каждую строку, не соответствующую моему регулярному выражению.

Мой файл:

MIME-Version: 1.0
Content-Type: Multipart/Related;boundary=MIME_boundary;

--MIME_boundary
Content-Type: application/xop+xml;

<msg><tag date="1557417027960" session="1697"><decision object="B04DWHEF" reliability="95" context="RO" x="796" y="371" width="89" height="18" direction="front"><jpeg></jpeg></decision></tag></msg>

Content-Type: application/octet-stream;
Content-Transfer-Encoding: binary;
Content-ID: A;
Content-Length: 30217;

����Lavc57.89.100��C...

Я хочу только этот результат:

<msg><tag date="1557417027960" session="1697"><decision object="B04DWHEF" reliability="95" context="RO" x="796" y="371" width="89" height="18" direction="front"><jpeg></jpeg></decision></tag></msg>

1 Ответ

0 голосов
/ 13 мая 2019

Спасибо вам, Шубхам, за регулярное выражение, мое решение найти только XML без другого контента в той же строке:

grep -o "<.*>.*</.*>" file_name 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...