В общем случае вы не можете проанализировать HTML с помощью регулярных выражений.
Но для простого случая и при условии, что ни один тег не занимает более двух строк, вы можете использовать:
sed -e 's/<[^<>]*>//g' -e 's/<[^<>]*$//' -e 's/^[^<>]*>//'
Первое регулярное выражение находит и удаляет теги, содержащиеся в одной строке.Вторая заботится о тегах, которые начинаются на строке, но заканчиваются на следующей.Третий удаляет хвосты тегов, которые начались в предыдущей строке.Если тег может занимать более двух строк, тогда требуется нечто более сложное (или более совершенный инструмент).