Я хочу удалить теги html с помощью sed, но мой скрипт не работает - PullRequest
0 голосов
/ 26 мая 2020

Я хочу удалить все теги файла html, ниже мой код. Мое t

Заголовок

размышление: когда встречает тег <, затем соединяйте все строки и выполняйте замену. Но код не работает? Любые идеи? Спасибо миллион.

sed '/</{
:loop
N
b loop
s/<[^<]*>//g
}
' index.html

1 Ответ

0 голосов
/ 26 мая 2020

Гадание ... Попытка получить общую картину ...

Вам нужно преобразовать HTML в текст:)

Итак, как насчет чистого и правильного способа делать это?

html2text index.html

Проверить http://www.mbayer.de/html2text/

...