Я считаю, что это то, что вы ищете:
!"#$%&'()*+,-./0123456789:;?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[]\\^_`abcdefghijklmnopqrstuvwxyz{|}~¡¢£¤¥¦§¨©ª«®¯°±²³´µ¶•¸¹º»¼½¾¿ÀÁÂÃÄÅàáâäèçéêëìíîïôö÷òóõùúý
Вам просто нужно использовать более качественную HTML-библиотеку / инструмент кодирования. Тот, который я использовал для генерации этого кода, основан на Ruby - я использовал библиотеку HTML Entities . Код, который я написал для этого, следующий. Мне пришлось поместить ваш текст в input.txt, чтобы сохранить Unicode (в строке был символ EOF), но он отлично работал.
require 'rubygems'
require 'htmlentities'
str = File.read('input.txt')
coder = HTMLEntities.new
puts coder.encode(str, :named)