Question

Я хочу извлечь данные между известными тегами HTML. Например:

Hello, <i>I<i> am <i>very</i> glad to meet you.

Должно стать:

'I

very'

Итак, я нашел что-то, что почти делает это. К сожалению, он извлекает только последнюю запись.

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

Теперь я могу добавить любой конечный тег </i> с символом новой строки, и это прекрасно работает. Но есть ли способ сделать это с помощью одной команды sed?

Dennis Williamson · Answer 1 · 28 августа 2010

Попробуйте:

sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'

И в вашем примере отсутствует "/":

Hello, <i>I</i> am <i>very</i> glad to meet you.

Извлечение данных HTML-тега с помощью sed

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлечение данных HTML-тега с помощью sed

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы