Просто укажите выходную кодировку (входная кодировка необязательна) в файле конфигурации:
input-encoding: win1252
output-encoding: latin1
Для обзора доступных кодировок см. Документацию выходной кодировки .
РЕДАКТИРОВАТЬ: Таким образом, вы используете .NET привязки . Это те же самые настройки:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
При правильном кодировании вы получите правильный результат без ü
и т. П.