Я знаю, что существует множество тем по этой проблеме, но мне не удалось найти ту, которая решает мою проблему.
Я пытаюсь напечатать строку, но при печати на ней не отображаются специальные символы (например, æ, ø, å, ö и ü). Когда я печатаю строку, используя repr()
, я получаю следующее:
u'Von D\xc3\xbc'
и u'\xc3\x96berg'
Кто-нибудь знает, как я могу преобразовать это в Von Dü
и Öberg
? Для меня важно, чтобы эти символы не игнорировались, например, myStr.encode("ascii", "ignore")
.
EDIT
Это код, который я использую. Я использую BeautifulSoup, чтобы очистить сайт. Содержимое ячейки (<td>
) в таблице (<table>
) помещается в переменную name
. Это переменная, которая содержит специальные символы, которые я не могу напечатать.
web = urllib2.urlopen(url);
soup = BeautifulSoup(web)
tables = soup.find_all("table")
scene_tables = [2, 3, 6, 7, 10]
scene_index = 0
# Iterate over the <table>s we want to work with
for scene_table in scene_tables:
i = 0
# Iterate over < td> to find time and name
for td in tables[scene_table].find_all("td"):
if i % 2 == 0: # td contains the time
time = remove_whitespace(td.get_text())
else: # td contains the name
name = remove_whitespace(td.get_text()) # This is the variable containing "nonsense"
print "%s: %s" % (time, name,)
i += 1
scene_index += 1