Вы можете исправить некоторые символы, заменив их, но не все. Декодируя данные с использованием неправильной кодировки, вы уже удалили некоторую информацию, и получить ее невозможно.
Вы должны выяснить, какова правильная кодировка для этих страниц, и использовать ее при декодировании данных.
Некоторые страницы имеют кодировку в заголовке ответа, например,
Content-Type: text/html; charset=utf8
Некоторые страницы имеют кодировку в заголовке HTML, например,
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
Если информация отсутствует в заголовке, вам сначала нужно будет декодировать страницу (или хотя бы ее часть) с использованием кодировки ASCII (что не является проблемой, поскольку метатег не содержит специальных символов), выясните, кодирование, затем декодируйте страницу, используя правильную кодировку.