Найти / заменить htmlentities, используя стандартный набор инструментов linux? - PullRequest
9 голосов
/ 24 июля 2010

Есть ли способ сделать что-то вроде следующего, используя стандартный набор инструментов linux?

Скажем, источник на example.com/index.php:

Hello, & world! "

Как я могу сделать что-то подобное ...

curl -s http://example.com/index.php | htmlentities

... это напечатало бы следующее:

Hello, & world! "

Использовать только стандартный набор инструментов linux?

Ответы [ 2 ]

18 голосов
/ 24 июля 2010

Использование recode.

$ echo 'Hello, & world! "' | recode HTML_4.0
Hello, & world! "

РЕДАКТИРОВАТЬ : Кстати, recode предлагает несколько разных преобразований, соответствующих различным версиям HTML и XML, так что вы можете использовать, например, HTML_3.2 вместо HTML_4.0, если у вас действительно старый HTML-документ. Запуск recode -l выведет полный список кодировок, поддерживаемых программой.

5 голосов
/ 24 июля 2010
alias decode="php -r 'echo html_entity_decode(fgets( STDIN ));'"

$ echo 'Hello, & world! "' | decode
Hello, & world! "
...