Как получить несколько строк со страницы HTML - PullRequest
0 голосов
/ 05 марта 2012

У меня есть HTML-страница с множеством таких тегов, как этот

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>

<tr>
 <td> a </td>
</tr>

Мне нужно выполнить grep для всех этих блоков в одиночку, оставив все остальное содержимое (например, общий текст).

Я видел некоторыедругой пост на pcregrep, но он мне не был понятен.

Может кто-нибудь помочь мне с grep (или любым другим решением)?

Ответы [ 2 ]

1 голос
/ 05 марта 2012

Вы можете использовать sed, чтобы получить все эти блоки:

$ sed -n '/<tr>/,/<\/tr>/p' input.html
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>
<tr>
 <td> a </td>
</tr>
0 голосов
/ 05 марта 2012

Смотрите мой ответ на этот предыдущий вопрос .В основном вы используете опцию grep s -z и очень специфическое регулярное выражение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...