Резка HTML в Bash - PullRequest
       30

Резка HTML в Bash

0 голосов
/ 16 декабря 2018

В настоящее время я пытаюсь вырезать файл HTML для определенной фразы или между двумя фразами.

<code><p>unneeded text and top of webpage</p>
    <h2><span style="font-size&#58;18px;">text1</span></h2><pre><b>text2&#58;</b>
admin (you)
    password&#58; password1
adminline2
    password&#58; password2
adminline3
    password&#58; password3
adminline4
    password&#58; password4

<b>Authorized Users&#58;</b>
userline
userline2
userline3

text3text3

1 Ответ

0 голосов
/ 16 декабря 2018

Согласно желаемому результату, можете ли вы проверить, работает ли это:

sed -n '/<h2>/,/<\/pre>/p' file_name

Объяснение:

По мере необходимости вам нужны линии между шаблонами, начинающимися с <h2>--start pattern и </pre> --End patternЯ включил их в синтаксис sed

sed -n '/start_pattern_here/,/end_pattern_here/p' file_name


-n     : Suppress automatic printing of pattern space
p      : Print the current pattern space
...