Выясните, какую кодировку использует веб-страница (вероятно, utf-8 или ISO 8859-5), и преобразуйте текст в кодировку Unicode, например:
ustring = unicode(read_string, encoding=...)
Если вам необходимо определить кодировку веб-страницыдинамически см. этот SO ответ.