Какой модуль CPAN вы бы порекомендовали для преобразования HTML в форматированный простой текст?
Одно строгое требование состоит в том, что модуль должен обрабатывать символы Юникода.
Мне нравится HTML :: FormatText и HTML :: FormatText :: WithLinks
См. Пример сценария htext , который поставляется с HTML :: Parser .