sed 's/<[^>]\+>//g'
удалит все теги, но вы можете заменить их пробелом, чтобы расположенные рядом теги не работали вместе: <td>one</td><td>two</td>
, становясь: onetwo
. Таким образом, вы можете сделать sed 's/<[^>]\+>/ /g'
, чтобы вывести one two
(ну, на самом деле one two
).
Это говорит о том, что если вам не нужен только необработанный текст, и кажется, что вы пытаетесь выполнить некоторые преобразования в данных после удаления тегов, язык сценариев, такой как Perl, мог бы быть более подходящим инструментом для выполнения этих вещей.
Поскольку мю слишком короткое, упоминание о том, что очистка HTML может быть немного рискованной, лучше всего использовать для этого то, что фактически анализирует HTML. PHPs DOM API довольно хорош для такого рода вещей.