Вот быстрый Perl вопрос:
Как я могу преобразовать специальные символы HTML, такие как ü
или '
, в обычный текст ASCII?
Я начал с чего-то вроде этого:
s/\&#(\d+);/chr($1)/eg;
и могли бы написать это для всех символов HTML, но какая-то функция, подобная этой, возможно, уже существует?
Обратите внимание, что мне не нужен полный HTML-> текстовый конвертер. Я уже разбираю HTML с HTML::Parser
. Мне просто нужно преобразовать текст с помощью специальных символов, которые я получаю.